Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Agrega un glosario #25

Draft
wants to merge 15 commits into
base: master
Choose a base branch
from
8 changes: 4 additions & 4 deletions 01-introduccion.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -10,7 +10,7 @@ El proceso de ciencia de datos en el cual nos vamos a basar se puede ver en el s
![Mapa conceptual del proceso de ciencia de datos](img/ciencia-de-datos.png)

Primero, debes **importar** tus datos hacia la herramienta donde vas a procesarlos.
Típicamente, esto implica tomar datos que están guardados en un archivo o base de datos y cargarlos en tu software para poder trabajar con ellos.
Típicamente, esto implica tomar datos que están guardados en un archivo o `r gdef("base de datos")` y cargarlos en tu software para poder trabajar con ellos.

Una vez que has importado los datos, el siguiente paso es **ordenarlos** para que tengan un formato adecuado para su análisis.
Este formato pensado para el análisis tiene la característica que, en los conjuntos de datos ordenados, *cada columna es una variable y cada fila una observación*.
Expand All @@ -33,15 +33,15 @@ Los modelos son herramientas estadísticas o computacionales y tienen supuestos
El último paso en el proceso de la ciencia de datos es la **comunicación**, una parte crítica de cualquier proyecto de análisis de datos, porque es cuando vas a mostrar tus resultados a otras personas y necesitas que puedan comprenderlos y encontrarlos útiles para utilizarlos.

Alrededor de todas estas herramientas se encuentra la **programación** como herramienta transversal en el proyecto de ciencia de datos.
No necesitás ser una persona experta en programación para hacer ciencia de datos, pero aprender más sobre programar te ayudará a automatizar tareas recurrentes, compartir tu trabajo de forma reusable y aprovechar el trabajo de otros para resolver problemas similares con mayor facilidad y rapidez.
No necesitás ser una persona experta en `r gdef("programación")` para hacer ciencia de datos, pero aprender más sobre programar te ayudará a automatizar tareas recurrentes, compartir tu trabajo de forma reusable y aprovechar el trabajo de otras personas para resolver problemas similares con mayor facilidad y rapidez.

En este cuadernillo te mostraremos como realizar cada una de estas etapas utilizando el software R y te dejaremos links donde puedes aprender y profundizar más cada aspecto de este proceso.

## ¿Por qué R?

Excel es un software admirable.
Es genial para hacer data entry, para ver los datos crudos y para hacer gráficos rápidos.
Si venís usándolo hace tiempo, seguro que aprendiste un montón de trucos para sacarle el jugo al máximo, habrás aprendido a usar fórmulas, tablas dinámicas, e incluso macros.
Es genial para hacer ingreso de datos (_data entry_ en inglés), para ver los datos crudos y para hacer gráficos rápidos.
Si venís usándolo hace tiempo, seguro que aprendiste un montón de trucos para sacarle el jugo al máximo, habrás aprendido a usar fórmulas, tablas dinámicas, e incluso `r gdef("macros").
Pero seguro que también sufriste sus limitaciones.

En una hoja de Excel no hay un límite claro entre datos y análisis.
Expand Down
4 changes: 0 additions & 4 deletions DT6_ciencia_de_datos_turismo.Rproj
Original file line number Diff line number Diff line change
Expand Up @@ -13,7 +13,3 @@ RnwWeave: Sweave
LaTeX: pdfLaTeX

BuildType: Website

MarkdownWrap: Sentence

SpellingDictionary: es_ES
14 changes: 14 additions & 0 deletions glosario.yml
Original file line number Diff line number Diff line change
Expand Up @@ -13,3 +13,17 @@ github:
repositorio:
nombre: Repositorio
def: Lugar en el que un sistema de control de versión guarda los archivos que conforman un proyecto y los metadatos que describen su historia.

base-de-datos:
nombre: Base de Datos
def: Una base de datos que organiza la información en tablas, cada una de las cuales tiene un set fijo de campos con nombre (que se muestran como columnas) y un número variable de registros (que se muestran como filas)

programacion:
Copy link
Collaborator Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Creo que esto debería ser programación (con tilde) para que r gdef("programación") funcione. Sino hay que hacer r gdef("programación", "programacion")` (el primero es el texto que va a aparecer y el segundo es el "id" del término.

nombre: Programación
def: proceso por el cual una persona desarrolla un programa, valiéndose de una herramienta que le permita escribir el código en un lenguaje de programación y de otra que sea capaz de traducirlo a lo que se conoce como lenguaje de máquina, que puede comprender la computadora.

macro:
nombre: macro
def: serie de instrucciones que se almacenan, generalmente en el mismo software que las utiliza, para que se puedan ejecutar de manera secuencial mediante una sola llamada u orden de ejecución con el objetivo de automatizar tareas.