forked from hadley/r4ds
-
Notifications
You must be signed in to change notification settings - Fork 131
/
02-explore.qmd
19 lines (11 loc) · 2.37 KB
/
02-explore.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# Introducción {#explorar-introduccion}
El objetivo de la primera parte de este libro es introducirte en las herramientas básicas de _exploración de datos_ de la manera más veloz posible. La exploración de datos es el arte de mirar tus datos, generar hipótesis rápidamente, testearlas con celeridad y luego repetir el proceso de manera iterativa. El objetivo de la exploración de datos es generar muchos hallazgos prometedores que luego puedas retomar para explorarlos en mayor profundidad.
```{r echo = FALSE, out.width = "75%"}
knitr::include_graphics("diagrams_w_text_as_path/es/data-science-explore.svg")
```
En esta parte del libro aprenderás algunas herramientas útiles que tienen un beneficio inmediato:
* La visualización es un buen lugar en el que comenzar a programar en R, ya que el retorno que se obtiene es claro: puedes crear gráficos elegantes e informativos que te ayuden a entender los datos. En el capítulo sobre [visualización de datos] vas a profundizar en este tema y aprenderás la estructura básica de un gráfico en **ggplot2**, técnicas que te permitirán convertir datos en gráficos.
* La visualización por sí sola a menudo no es suficiente, por lo que en [transformación de datos] aprenderás los verbos clave que te permitirán seleccionar variables importantes, filtrar observaciones, crear nuevas variables y calcular estadísticos que resuman información.
* Finalmente, en [análisis exploratorio de datos (_EDA_)] vas a combinar visualización y transformación con tu curiosidad y escepticismo para formular y responder preguntas en torno a los datos.
Si bien el modelamiento es un aspecto importante del proceso exploratorio, aún no tienes las habilidades para aprenderlo con efectividad o aplicarlo. Volveremos sobre este tema en el [capítulo introductorio de Modelos](#model-intro), una vez que ya tengas las herramientas de manejo de datos y programación.
Entre estos tres capítulos que enseñan las herramientas de exploración de datos hay otros tres capítulos que se enfocan en el flujo de trabajo en R. En [flujo de trabajo: conocimientos básicos], [flujo de trabajo: Scripts] y [flujo de trabajo: proyectos] aprenderás buenas prácticas para escribir y organizar tu código en R. Estas prácticas te prepararán para el éxito a largo plazo, en términos de que te entregan las herramientas necesarias para organizarte cuando abordes proyectos reales.