From eccce0dffd9b7569fe040a34a68f77e8eb4f0021 Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 16:42:25 -0300 Subject: [PATCH 01/14] Intento de glosario --- 96-glosario.Rmd | 10 ++++++++++ index.Rmd | 2 ++ 2 files changed, 12 insertions(+) create mode 100644 96-glosario.Rmd diff --git a/96-glosario.Rmd b/96-glosario.Rmd new file mode 100644 index 0000000..2dde91b --- /dev/null +++ b/96-glosario.Rmd @@ -0,0 +1,10 @@ +# Glosario + +```{r include=FALSE} +library(glosario) +g <- get_glossary() + +``` + +CRAN + : Repositorio diff --git a/index.Rmd b/index.Rmd index 3ba0ada..de31e41 100644 --- a/index.Rmd +++ b/index.Rmd @@ -44,5 +44,7 @@ knitr::write_bib(c( ), 'packages.bib') knitr::opts_chunk$set(out.width = '100%', fig.align = 'center') + ``` +[CRAN](#cran "Repositorio") From f3206d1d0ddc8f140855592be9eb189c0103750b Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:03:41 -0300 Subject: [PATCH 02/14] Intento de glosario #23 --- 96-glosario.Rmd | 12 +++++++----- glosario.yml | 4 ++++ index.Rmd | 16 +++++++++++++++- 3 files changed, 26 insertions(+), 6 deletions(-) create mode 100644 glosario.yml diff --git a/96-glosario.Rmd b/96-glosario.Rmd index 2dde91b..7a7d105 100644 --- a/96-glosario.Rmd +++ b/96-glosario.Rmd @@ -1,10 +1,12 @@ # Glosario -```{r include=FALSE} -library(glosario) -g <- get_glossary() +```{r echo=FALSE, results='asis'} +glosario <- yaml::read_yaml("glosario.yml") +sink <- lapply(seq_along(glosario), function(i) { + cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) +}) ``` -CRAN - : Repositorio + + diff --git a/glosario.yml b/glosario.yml new file mode 100644 index 0000000..f2e6a8f --- /dev/null +++ b/glosario.yml @@ -0,0 +1,4 @@ +cran: + nombre: CRAN + def: Un repositorio + diff --git a/index.Rmd b/index.Rmd index de31e41..efb2ef8 100644 --- a/index.Rmd +++ b/index.Rmd @@ -45,6 +45,20 @@ knitr::write_bib(c( knitr::opts_chunk$set(out.width = '100%', fig.align = 'center') + +glosario <- yaml::read_yaml("glosario.yml") + +gdef <- function(texto, clave = NULL) { + if (is.null(clave)) { + clave <- gsub(" ", "-", tolower(texto)) + } + + def <- glosario[[clave]]$def + + paste0("[", texto, "](#", clave, " \"", def, "\")") + +} + ``` -[CRAN](#cran "Repositorio") +`r gdef("CRAN")` From fa0993f54fbd81b3a213099a48702a283082a7ec Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:05:16 -0300 Subject: [PATCH 03/14] Corrije erorres --- 96-glosario.Rmd | 2 +- index.Rmd | 4 ++++ 2 files changed, 5 insertions(+), 1 deletion(-) diff --git a/96-glosario.Rmd b/96-glosario.Rmd index 7a7d105..4ad7c56 100644 --- a/96-glosario.Rmd +++ b/96-glosario.Rmd @@ -3,7 +3,7 @@ ```{r echo=FALSE, results='asis'} glosario <- yaml::read_yaml("glosario.yml") sink <- lapply(seq_along(glosario), function(i) { - cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) + cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) }) ``` diff --git a/index.Rmd b/index.Rmd index efb2ef8..3c9d592 100644 --- a/index.Rmd +++ b/index.Rmd @@ -55,6 +55,10 @@ gdef <- function(texto, clave = NULL) { def <- glosario[[clave]]$def + if (is.null(def)) { + stop("No se encontró definición para el término ", clave) + } + paste0("[", texto, "](#", clave, " \"", def, "\")") } From 27fe59d65bd31398909897c4aa1863649b7cc96b Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:49:00 -0300 Subject: [PATCH 04/14] Agrega un par de definiciones --- 96-glosario.Rmd | 5 ++++- glosario.yml | 13 ++++++++++++- 2 files changed, 16 insertions(+), 2 deletions(-) diff --git a/96-glosario.Rmd b/96-glosario.Rmd index 4ad7c56..66ee6eb 100644 --- a/96-glosario.Rmd +++ b/96-glosario.Rmd @@ -2,8 +2,11 @@ ```{r echo=FALSE, results='asis'} glosario <- yaml::read_yaml("glosario.yml") +nombres <- vapply(glosario, function(x) x$nombre, character(1)) +glosario <- glosario[order(nombres)] + sink <- lapply(seq_along(glosario), function(i) { - cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) + cat(paste0(glosario[[i]]$nombre, " ", "\n : ", glosario[[i]]$def, "\n\n")) }) ``` diff --git a/glosario.yml b/glosario.yml index f2e6a8f..7369447 100644 --- a/glosario.yml +++ b/glosario.yml @@ -1,4 +1,15 @@ cran: nombre: CRAN - def: Un repositorio + def: Acrónimo de Comprehensive R Archive Network, un servicio que mantiene un repositorio de paquetes "oficial" de R. +datos-ordenados: + nombre: Datos Ordenados + def: Datos tabulares que satisfacen tres condiciones que facilitan su limpieza inicial y su posterior exploración y análisis—(1) cada variable conforma una columna, (2) cada observación conforma una fila y (3) cada tipo de unidad de observación conforma una tabla. + +github: + nombre: GitHub + def: Una plataforma web que permite guardar repositorios online con control de versiones y colaborar con otras personas. + +repositorio: + nombre: Repositorio + def: Lugar en el que un sistema de control de versión guarda los archivos que conforman un proyecto y los metadatos que describen su historia. From 0fb317657c89cf7c918d0be911de0cb868c7e91c Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:55:07 -0300 Subject: [PATCH 05/14] Agrega links a algunas palabras --- 01-introduccion.Rmd | 2 +- "90-desaf\303\255os.Rmd" | 4 ++-- 95-instalacion.Rmd | 3 ++- index.Rmd | 2 +- 4 files changed, 6 insertions(+), 5 deletions(-) diff --git a/01-introduccion.Rmd b/01-introduccion.Rmd index 046ba29..f7ab098 100644 --- a/01-introduccion.Rmd +++ b/01-introduccion.Rmd @@ -14,7 +14,7 @@ Típicamente, esto implica tomar datos que están guardados en un archivo o base Una vez que has importado los datos, el siguiente paso es **ordenarlos** para que tengan un formato adecuado para su análisis. Este formato pensado para el análisis tiene la característica que, en los conjuntos de datos ordenados, *cada columna es una variable y cada fila una observación*. -Tener datos ordenados nos provee una estructura consistente, preparada para analizarlos y podemos enfocar nuestros esfuerzos en las preguntas que queremos contestar con nuestros datos y no tener que acomodarlos cada vez que la pregunta cambie. +Tener `r gdef("datos ordenados")` nos provee una estructura consistente, preparada para analizarlos y podemos enfocar nuestros esfuerzos en las preguntas que queremos contestar con nuestros datos y no tener que acomodarlos cada vez que la pregunta cambie. Cuando tus datos están ordenados, podemos necesitar *transformarlos*. La transformación implica quedarte con las observaciones que sean de interés (como todos los hoteles de una ciudad o todos los datos del último año), crear nuevas variables que a partir de variables ya existentes (como calcular el porcentaje de ocupación a partir de la cantidad de plazas totales y las ocupadas) y calcular una serie de estadísticos de resumen (como recuentos y medias). diff --git "a/90-desaf\303\255os.Rmd" "b/90-desaf\303\255os.Rmd" index 28d0c58..ea61c9d 100644 --- "a/90-desaf\303\255os.Rmd" +++ "b/90-desaf\303\255os.Rmd" @@ -25,10 +25,10 @@ remotes::install_github("ciencia_datos/datos") ``` La tercera linea, si bien distinta a las anteriores, también instala un paquete. -La diferencia es que instala el paquete desde un repositorio de GitHub donde suelen estar los paquetes en desarrollo en vez de desde el repositorio oficial de R (CRAN). +La diferencia es que instala el paquete desde un `r gdef("repositorio")` de `r gdef("GitHub")` donde suelen estar los paquetes en desarrollo en vez de desde el repositorio oficial de R (`r gdef("CRAN")`). 4. Creá un nuevo archivo R Markdown que se llame "01-lectura.Rmd" desde File -> New File -> R Markdown. -Si bien el archivo puede tener cualquer nombre, siempre que sea informativo, te proponemos nombrarlos como número-nombre para poder ordenarlos y que te resulte más fácil encontrarlo dentro del proyecto. +Si bien el archivo puede tener cualquier nombre, siempre que sea informativo, te proponemos nombrarlos como número-nombre para poder ordenarlos y que te resulte más fácil encontrarlo dentro del proyecto. Es posible que necesites darle permiso a RStudio para que instale nuevos paquetes asociados a R Markdown. Te va a aparecer la plantilla por defecto; borrá todas las líneas empezando por la que dice `## R Markdown` (inclusive) y guardá el archivo. (Para guardar tenés podés ir a File -> Save o hacer click en en el disquette 💾). diff --git a/95-instalacion.Rmd b/95-instalacion.Rmd index bc8ef5d..b628acb 100644 --- a/95-instalacion.Rmd +++ b/95-instalacion.Rmd @@ -47,7 +47,8 @@ c(make = "C:\\rtools40\\usr\\bin\\make.exe") ### Ubuntu o derivados {-} -Para tener la última versión, tenés que agregar los repositorios de CRAN. Para hacerlo, vas a tener que tener permisos de administrador. +Para tener la última versión, tenés que agregar los `r gdef("repositorios", "repositorio")` de `r gdef("CRAN")`. +Para hacerlo, vas a tener que tener permisos de administrador. Los detalles están en [esta](https://cran.r-project.org/bin/linux/ubuntu/) página, pero el resumen es: ```bash diff --git a/index.Rmd b/index.Rmd index 3c9d592..420b1de 100644 --- a/index.Rmd +++ b/index.Rmd @@ -65,4 +65,4 @@ gdef <- function(texto, clave = NULL) { ``` -`r gdef("CRAN")` + From 1b8390d866d34f3d1c9163cc8d91597f0220cbee Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Thu, 14 Oct 2021 10:02:40 -0300 Subject: [PATCH 06/14] =?UTF-8?q?Agrega=20extra=20potenciaci=C3=B3n?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 01-introduccion.Rmd | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/01-introduccion.Rmd b/01-introduccion.Rmd index f7ab098..39fb556 100644 --- a/01-introduccion.Rmd +++ b/01-introduccion.Rmd @@ -107,7 +107,7 @@ R entiende un montón de operaciones aritméticas escritas como seguramente ya t - `-`: restar - `*`: multiplicar - `/`: dividir -- `^`: exponenciar +- `^` o `**`: exponenciar Pero además conoce muchas otras operaciones. Para decirle a R que calcule el seno de 1 hay que escribir esto: From d9148ad54d156e49778ddce600e719307b84f5b0 Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Thu, 14 Oct 2021 10:09:06 -0300 Subject: [PATCH 07/14] Pasa a heading 2 --- 02-proyectos.Rmd | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/02-proyectos.Rmd b/02-proyectos.Rmd index 098db74..7811b6e 100644 --- a/02-proyectos.Rmd +++ b/02-proyectos.Rmd @@ -5,7 +5,7 @@ Trabajar con proyectos de RStudio no solo hace tus análisis más ordenados y re Al comienzo posiblemente tengas un script y uno o dos archivos con datos, pero es posible que rápidamente te encuentres con una docena de archivos con nombres parecidos pero que pertenecen a análisis totalmente distintos. Antes de que la cosa comience a complicarse te proponemos trabajar con proyectos. -### ¿Qué ventajas tiene? +## ¿Qué ventajas tiene? - Te permite "cuidar" los datos que usas al ordenarnos en carpetas que diferencien entre la versión original o cruda y los datos limpios o los resultados finales. - Te permite compartir tu trabajo fácilmente con otras personas. Solo tendrías que compartir la carpeta del proyecto sabiendo que incluye todo lo necesario para que cualquiera reproduzca tu análisis. @@ -26,7 +26,7 @@ Antes de que la cosa comience a complicarse te proponemos trabajar con proyectos Si todo salió bien, ahora deberías tener una nueva carpeta que se llama *mi_proyecto*. Pero si bien es una carpeta común y corriente, le llamamos proyecto porque además contiene un archivo con el mismo nombre *mi_proyecto.Rproj* (o solo *mi_proyecto* si en tu computadora no ves la extensión de los archivos). -### Abrir un proyecto +## Abrir un proyecto La manera más simple de abrir un proyecto es abriendo la carpeta que lo contiene y haciendo doble click sobre el archivo *mi_proyecto.Rproj*. Al hacer esto se abrirá RStudio y la sesión de R en la misma carpeta y, por defecto, cualquier archivo que quieras abrir o guardar lo hará en esa misma ubicación. @@ -43,7 +43,7 @@ Si en algún momento trabajas con proyectos en paralelo vas a poder hacerlo sin 3. Hacé doble click en el archivo que tiene el nombre de tu proyecto (y que termina con *.Rproj*) que encontrarás en esa carpeta. ::: -### ¿Cómo se organiza? +## ¿Cómo se organiza? No existe una "mejor" forma de organizar un proyecto pero acá van algunos principios generales que nos hacen la vida más simple:: @@ -51,7 +51,7 @@ No existe una "mejor" forma de organizar un proyecto pero acá van algunos princ - **Limpieza de datos** En muchos casos tus datos estarán "sucios", necesitarán un preprocesamiento importante para organizarlos en un formato que R (o cualquier otro lenguaje de programación) pueda analizados fácilmente. Esta tarea se denomina a veces "amasado" o "masticado de datos". Es una buena costumbre guardar el código que te permitió limpiar estos datos por si los volvieras a necesitar. También es recomendable guardar esa versión de los datos limpios, de "sólo lectura", para que puedas usarlos en tu análisis sin necesidad de repetir cada vez todo el proceso de limpieza de los datos. - **Tratar las salidas o resultados generados como descartables** Cualquier resultado (gráficos, tablas, valores) debe poder repetirse o rehacerse a partir del código guardado. Si bien las pruebas rápidas para *ver si el código funciona* se pueden hacer en la consola, es importante guardar el código que genera los resultados y asegurarnos de que sean reproducibles. Aún mejor, si organizas esos resultados en distintas sub-carpetas, luego tendrás todo aún más ordenado. -### Ordenando aún más +## Ordenando aún más Si tenés alguna experiencia programando con R es posible que tengas estás lineas al comienzo de alguno de tus scripts o si nunca las usaste, seguro viste que alguien más lo hacia: From 1058348a5c95bc9a8ca769a755312fb9ac3a604c Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Thu, 14 Oct 2021 10:09:29 -0300 Subject: [PATCH 08/14] =?UTF-8?q?Agrega=20potenciaci=C3=B3n?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 01-introduccion.Rmd | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/01-introduccion.Rmd b/01-introduccion.Rmd index 046ba29..b562032 100644 --- a/01-introduccion.Rmd +++ b/01-introduccion.Rmd @@ -107,7 +107,7 @@ R entiende un montón de operaciones aritméticas escritas como seguramente ya t - `-`: restar - `*`: multiplicar - `/`: dividir -- `^`: exponenciar +- `^` o `**`: exponenciar Pero además conoce muchas otras operaciones. Para decirle a R que calcule el seno de 1 hay que escribir esto: From 5d5c1049337cf0ea157e641ed1527694030e4cda Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 16:42:25 -0300 Subject: [PATCH 09/14] Intento de glosario --- 96-glosario.Rmd | 10 ++++++++++ index.Rmd | 2 ++ 2 files changed, 12 insertions(+) create mode 100644 96-glosario.Rmd diff --git a/96-glosario.Rmd b/96-glosario.Rmd new file mode 100644 index 0000000..2dde91b --- /dev/null +++ b/96-glosario.Rmd @@ -0,0 +1,10 @@ +# Glosario + +```{r include=FALSE} +library(glosario) +g <- get_glossary() + +``` + +CRAN + : Repositorio diff --git a/index.Rmd b/index.Rmd index 3ba0ada..de31e41 100644 --- a/index.Rmd +++ b/index.Rmd @@ -44,5 +44,7 @@ knitr::write_bib(c( ), 'packages.bib') knitr::opts_chunk$set(out.width = '100%', fig.align = 'center') + ``` +[CRAN](#cran "Repositorio") From 24897b15d77c0782adf5631be17e6c8db32393df Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:03:41 -0300 Subject: [PATCH 10/14] Intento de glosario #23 --- 96-glosario.Rmd | 12 +++++++----- glosario.yml | 4 ++++ index.Rmd | 16 +++++++++++++++- 3 files changed, 26 insertions(+), 6 deletions(-) create mode 100644 glosario.yml diff --git a/96-glosario.Rmd b/96-glosario.Rmd index 2dde91b..7a7d105 100644 --- a/96-glosario.Rmd +++ b/96-glosario.Rmd @@ -1,10 +1,12 @@ # Glosario -```{r include=FALSE} -library(glosario) -g <- get_glossary() +```{r echo=FALSE, results='asis'} +glosario <- yaml::read_yaml("glosario.yml") +sink <- lapply(seq_along(glosario), function(i) { + cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) +}) ``` -CRAN - : Repositorio + + diff --git a/glosario.yml b/glosario.yml new file mode 100644 index 0000000..f2e6a8f --- /dev/null +++ b/glosario.yml @@ -0,0 +1,4 @@ +cran: + nombre: CRAN + def: Un repositorio + diff --git a/index.Rmd b/index.Rmd index de31e41..efb2ef8 100644 --- a/index.Rmd +++ b/index.Rmd @@ -45,6 +45,20 @@ knitr::write_bib(c( knitr::opts_chunk$set(out.width = '100%', fig.align = 'center') + +glosario <- yaml::read_yaml("glosario.yml") + +gdef <- function(texto, clave = NULL) { + if (is.null(clave)) { + clave <- gsub(" ", "-", tolower(texto)) + } + + def <- glosario[[clave]]$def + + paste0("[", texto, "](#", clave, " \"", def, "\")") + +} + ``` -[CRAN](#cran "Repositorio") +`r gdef("CRAN")` From 9b2f9c8d26e31394c522f36f410a1290c6183347 Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:05:16 -0300 Subject: [PATCH 11/14] Corrije erorres --- 96-glosario.Rmd | 2 +- index.Rmd | 4 ++++ 2 files changed, 5 insertions(+), 1 deletion(-) diff --git a/96-glosario.Rmd b/96-glosario.Rmd index 7a7d105..4ad7c56 100644 --- a/96-glosario.Rmd +++ b/96-glosario.Rmd @@ -3,7 +3,7 @@ ```{r echo=FALSE, results='asis'} glosario <- yaml::read_yaml("glosario.yml") sink <- lapply(seq_along(glosario), function(i) { - cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) + cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) }) ``` diff --git a/index.Rmd b/index.Rmd index efb2ef8..3c9d592 100644 --- a/index.Rmd +++ b/index.Rmd @@ -55,6 +55,10 @@ gdef <- function(texto, clave = NULL) { def <- glosario[[clave]]$def + if (is.null(def)) { + stop("No se encontró definición para el término ", clave) + } + paste0("[", texto, "](#", clave, " \"", def, "\")") } From 1c9046c8de5e8fe574737c6ec72b9cc15456999d Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:49:00 -0300 Subject: [PATCH 12/14] Agrega un par de definiciones --- 96-glosario.Rmd | 5 ++++- glosario.yml | 13 ++++++++++++- 2 files changed, 16 insertions(+), 2 deletions(-) diff --git a/96-glosario.Rmd b/96-glosario.Rmd index 4ad7c56..66ee6eb 100644 --- a/96-glosario.Rmd +++ b/96-glosario.Rmd @@ -2,8 +2,11 @@ ```{r echo=FALSE, results='asis'} glosario <- yaml::read_yaml("glosario.yml") +nombres <- vapply(glosario, function(x) x$nombre, character(1)) +glosario <- glosario[order(nombres)] + sink <- lapply(seq_along(glosario), function(i) { - cat(paste0(glosario[[i]]$nombre, "", "\n : ", glosario[[i]]$def)) + cat(paste0(glosario[[i]]$nombre, " ", "\n : ", glosario[[i]]$def, "\n\n")) }) ``` diff --git a/glosario.yml b/glosario.yml index f2e6a8f..7369447 100644 --- a/glosario.yml +++ b/glosario.yml @@ -1,4 +1,15 @@ cran: nombre: CRAN - def: Un repositorio + def: Acrónimo de Comprehensive R Archive Network, un servicio que mantiene un repositorio de paquetes "oficial" de R. +datos-ordenados: + nombre: Datos Ordenados + def: Datos tabulares que satisfacen tres condiciones que facilitan su limpieza inicial y su posterior exploración y análisis—(1) cada variable conforma una columna, (2) cada observación conforma una fila y (3) cada tipo de unidad de observación conforma una tabla. + +github: + nombre: GitHub + def: Una plataforma web que permite guardar repositorios online con control de versiones y colaborar con otras personas. + +repositorio: + nombre: Repositorio + def: Lugar en el que un sistema de control de versión guarda los archivos que conforman un proyecto y los metadatos que describen su historia. From 89b1cd40abb91543df28191969e56e3a71aa3b73 Mon Sep 17 00:00:00 2001 From: Elio Campitelli Date: Tue, 12 Oct 2021 17:55:07 -0300 Subject: [PATCH 13/14] Agrega links a algunas palabras --- 01-introduccion.Rmd | 2 +- "90-desaf\303\255os.Rmd" | 4 ++-- 95-instalacion.Rmd | 3 ++- index.Rmd | 2 +- 4 files changed, 6 insertions(+), 5 deletions(-) diff --git a/01-introduccion.Rmd b/01-introduccion.Rmd index b562032..39fb556 100644 --- a/01-introduccion.Rmd +++ b/01-introduccion.Rmd @@ -14,7 +14,7 @@ Típicamente, esto implica tomar datos que están guardados en un archivo o base Una vez que has importado los datos, el siguiente paso es **ordenarlos** para que tengan un formato adecuado para su análisis. Este formato pensado para el análisis tiene la característica que, en los conjuntos de datos ordenados, *cada columna es una variable y cada fila una observación*. -Tener datos ordenados nos provee una estructura consistente, preparada para analizarlos y podemos enfocar nuestros esfuerzos en las preguntas que queremos contestar con nuestros datos y no tener que acomodarlos cada vez que la pregunta cambie. +Tener `r gdef("datos ordenados")` nos provee una estructura consistente, preparada para analizarlos y podemos enfocar nuestros esfuerzos en las preguntas que queremos contestar con nuestros datos y no tener que acomodarlos cada vez que la pregunta cambie. Cuando tus datos están ordenados, podemos necesitar *transformarlos*. La transformación implica quedarte con las observaciones que sean de interés (como todos los hoteles de una ciudad o todos los datos del último año), crear nuevas variables que a partir de variables ya existentes (como calcular el porcentaje de ocupación a partir de la cantidad de plazas totales y las ocupadas) y calcular una serie de estadísticos de resumen (como recuentos y medias). diff --git "a/90-desaf\303\255os.Rmd" "b/90-desaf\303\255os.Rmd" index 28d0c58..ea61c9d 100644 --- "a/90-desaf\303\255os.Rmd" +++ "b/90-desaf\303\255os.Rmd" @@ -25,10 +25,10 @@ remotes::install_github("ciencia_datos/datos") ``` La tercera linea, si bien distinta a las anteriores, también instala un paquete. -La diferencia es que instala el paquete desde un repositorio de GitHub donde suelen estar los paquetes en desarrollo en vez de desde el repositorio oficial de R (CRAN). +La diferencia es que instala el paquete desde un `r gdef("repositorio")` de `r gdef("GitHub")` donde suelen estar los paquetes en desarrollo en vez de desde el repositorio oficial de R (`r gdef("CRAN")`). 4. Creá un nuevo archivo R Markdown que se llame "01-lectura.Rmd" desde File -> New File -> R Markdown. -Si bien el archivo puede tener cualquer nombre, siempre que sea informativo, te proponemos nombrarlos como número-nombre para poder ordenarlos y que te resulte más fácil encontrarlo dentro del proyecto. +Si bien el archivo puede tener cualquier nombre, siempre que sea informativo, te proponemos nombrarlos como número-nombre para poder ordenarlos y que te resulte más fácil encontrarlo dentro del proyecto. Es posible que necesites darle permiso a RStudio para que instale nuevos paquetes asociados a R Markdown. Te va a aparecer la plantilla por defecto; borrá todas las líneas empezando por la que dice `## R Markdown` (inclusive) y guardá el archivo. (Para guardar tenés podés ir a File -> Save o hacer click en en el disquette 💾). diff --git a/95-instalacion.Rmd b/95-instalacion.Rmd index bc8ef5d..b628acb 100644 --- a/95-instalacion.Rmd +++ b/95-instalacion.Rmd @@ -47,7 +47,8 @@ c(make = "C:\\rtools40\\usr\\bin\\make.exe") ### Ubuntu o derivados {-} -Para tener la última versión, tenés que agregar los repositorios de CRAN. Para hacerlo, vas a tener que tener permisos de administrador. +Para tener la última versión, tenés que agregar los `r gdef("repositorios", "repositorio")` de `r gdef("CRAN")`. +Para hacerlo, vas a tener que tener permisos de administrador. Los detalles están en [esta](https://cran.r-project.org/bin/linux/ubuntu/) página, pero el resumen es: ```bash diff --git a/index.Rmd b/index.Rmd index 3c9d592..420b1de 100644 --- a/index.Rmd +++ b/index.Rmd @@ -65,4 +65,4 @@ gdef <- function(texto, clave = NULL) { ``` -`r gdef("CRAN")` + From 286462c81d394a72f8177615148c1bfe9e31c306 Mon Sep 17 00:00:00 2001 From: Yanina Date: Thu, 21 Oct 2021 07:51:11 -0300 Subject: [PATCH 14/14] Add glosario terms and minor changes on Introduccion --- 01-introduccion.Rmd | 8 ++++---- DT6_ciencia_de_datos_turismo.Rproj | 4 ---- glosario.yml | 14 ++++++++++++++ 3 files changed, 18 insertions(+), 8 deletions(-) diff --git a/01-introduccion.Rmd b/01-introduccion.Rmd index 39fb556..907efa4 100644 --- a/01-introduccion.Rmd +++ b/01-introduccion.Rmd @@ -10,7 +10,7 @@ El proceso de ciencia de datos en el cual nos vamos a basar se puede ver en el s ![Mapa conceptual del proceso de ciencia de datos](img/ciencia-de-datos.png) Primero, debes **importar** tus datos hacia la herramienta donde vas a procesarlos. -Típicamente, esto implica tomar datos que están guardados en un archivo o base de datos y cargarlos en tu software para poder trabajar con ellos. +Típicamente, esto implica tomar datos que están guardados en un archivo o `r gdef("base de datos")` y cargarlos en tu software para poder trabajar con ellos. Una vez que has importado los datos, el siguiente paso es **ordenarlos** para que tengan un formato adecuado para su análisis. Este formato pensado para el análisis tiene la característica que, en los conjuntos de datos ordenados, *cada columna es una variable y cada fila una observación*. @@ -33,15 +33,15 @@ Los modelos son herramientas estadísticas o computacionales y tienen supuestos El último paso en el proceso de la ciencia de datos es la **comunicación**, una parte crítica de cualquier proyecto de análisis de datos, porque es cuando vas a mostrar tus resultados a otras personas y necesitas que puedan comprenderlos y encontrarlos útiles para utilizarlos. Alrededor de todas estas herramientas se encuentra la **programación** como herramienta transversal en el proyecto de ciencia de datos. -No necesitás ser una persona experta en programación para hacer ciencia de datos, pero aprender más sobre programar te ayudará a automatizar tareas recurrentes, compartir tu trabajo de forma reusable y aprovechar el trabajo de otros para resolver problemas similares con mayor facilidad y rapidez. +No necesitás ser una persona experta en `r gdef("programación")` para hacer ciencia de datos, pero aprender más sobre programar te ayudará a automatizar tareas recurrentes, compartir tu trabajo de forma reusable y aprovechar el trabajo de otras personas para resolver problemas similares con mayor facilidad y rapidez. En este cuadernillo te mostraremos como realizar cada una de estas etapas utilizando el software R y te dejaremos links donde puedes aprender y profundizar más cada aspecto de este proceso. ## ¿Por qué R? Excel es un software admirable. -Es genial para hacer data entry, para ver los datos crudos y para hacer gráficos rápidos. -Si venís usándolo hace tiempo, seguro que aprendiste un montón de trucos para sacarle el jugo al máximo, habrás aprendido a usar fórmulas, tablas dinámicas, e incluso macros. +Es genial para hacer ingreso de datos (_data entry_ en inglés), para ver los datos crudos y para hacer gráficos rápidos. +Si venís usándolo hace tiempo, seguro que aprendiste un montón de trucos para sacarle el jugo al máximo, habrás aprendido a usar fórmulas, tablas dinámicas, e incluso `r gdef("macros"). Pero seguro que también sufriste sus limitaciones. En una hoja de Excel no hay un límite claro entre datos y análisis. diff --git a/DT6_ciencia_de_datos_turismo.Rproj b/DT6_ciencia_de_datos_turismo.Rproj index 0623f65..627a5fb 100644 --- a/DT6_ciencia_de_datos_turismo.Rproj +++ b/DT6_ciencia_de_datos_turismo.Rproj @@ -13,7 +13,3 @@ RnwWeave: Sweave LaTeX: pdfLaTeX BuildType: Website - -MarkdownWrap: Sentence - -SpellingDictionary: es_ES diff --git a/glosario.yml b/glosario.yml index 7369447..b0ccb91 100644 --- a/glosario.yml +++ b/glosario.yml @@ -13,3 +13,17 @@ github: repositorio: nombre: Repositorio def: Lugar en el que un sistema de control de versión guarda los archivos que conforman un proyecto y los metadatos que describen su historia. + +base-de-datos: + nombre: Base de Datos + def: Una base de datos que organiza la información en tablas, cada una de las cuales tiene un set fijo de campos con nombre (que se muestran como columnas) y un número variable de registros (que se muestran como filas) + +programacion: + nombre: Programación + def: proceso por el cual una persona desarrolla un programa, valiéndose de una herramienta que le permita escribir el código en un lenguaje de programación y de otra que sea capaz de traducirlo a lo que se conoce como lenguaje de máquina, que puede comprender la computadora. + +macro: + nombre: macro + def: serie de instrucciones que se almacenan, generalmente en el mismo software que las utiliza, para que se puedan ejecutar de manera secuencial mediante una sola llamada u orden de ejecución con el objetivo de automatizar tareas. + +