Skip to content

Latest commit

 

History

History
188 lines (125 loc) · 6.11 KB

intro.md

File metadata and controls

188 lines (125 loc) · 6.11 KB

R Intro

author: I. Bartomeus date: Nov 2016 autosize: true

Como serán los siguientes 5 días de vuestra vida?

  • Introducción (yo hablando; 45')
  • Programación en R (yo) + Visualización de datos (Paco)
  • Modelos mixtos (yo) + Modelos nulos (yo)
  • Bayesiano (Paco) + Simulaciones (yo)
  • Multivariante (yo) + git (Paco)
  • GIS (Paco) + "a jugar" (Paco y yo)

Feedback: Email: nacho.bartomeus@gmail.com

Twitter @ibartomeus

Como se estructuran las clases

  • Cursos de R online y libros hay a patadas.
  • Aquí venimos a equivocarnos cuanto más mejor
  • Resolveremos cuantos más problemas mejor
  • Sistema de posit it para los ejercicios.

Objetivos

  • Entender las ventajas de usar R (o otros lenguages de programación)
  • Que descubrais que con R se puede hacer casi todo (desde esta presentación hasta pedir pizza)
  • Saber suficiente R para poder "googlear" lo que necesiteis aprender/resolver a partir de ahora.

Los Básicos

  • Download R
  • R desde Rstudio (download Rstudio)
  • Material del curso
  • Carpeta 'ejercicios' y 'ejercicios_resueltos'

Y si no se algo? Uso de Stackoverflow.

Baremo del problema:

  • consulta (hasta 5 pestañas abiertas)
  • problema (hasta 10 pestañas abiertas)
  • marrón (> 10 pestañas)

Por que R?

R has simple and obvious appeal. Through R, you can sift through complex data sets, manipulate data through sophisticated modeling functions, and create sleek graphics to represent the numbers, in just a few lines of code...R’s greatest asset is the vibrant ecosystem has developed around it: The R community is constantly adding new packages and features to its already rich function sets.

-- The 9 Best Languages For Crunching Data

Seguro que R es la herramienta adecuada?

No siempre. R tiene limitaciones y debilidades:

  • Curva de aprendizage; syntaxis incosistente
  • Documentación fragmentada (?help, vignettes, etc...)
  • Calidad de los paquetes varia
  • No esta diseñado para grandes bases de datos (~100 Mb de csv)

Hay otras herramientas:

  • Julia, Python, C++, bash, ...
  • Excel? Casi nunca.

La verdadera ventaja de usar R: Reproducibilidad

It’s important to make a workflow that you can use time and time again, and even pass on to others in such a way that you don’t have to be there to walk them through it. Source

Your closest collaborator is you 6 months ago, and you don't respond to emails. P. Wilson

Interested: read our paper

No puedes reproducir

...Lo que no existe.

  • Gozilla se ha comido mi ordenador
    • backup
    • idealmente de forma continua
  • Godzilla se ha comido mi oficina
    • cloud

No puedes reproducir

...lo que has perdido. Y si necesitas un archivo que existio hace 1, 10 o 100 dias?

  • Incremental backups (minimo)
  • Version control (mejor). Git (y GitHub) es el más popular

Estadística

  • Es una ciencia dinámica.
  • Es una ciencia compleja y con diversas filosofias.
  • Es una herramienta, no un fin.
  • No puede solucionar malos datos (e.g. baja replicación).
  • No puede solucionar un mal diseño experimental.

Abrir R studio

  • scripts
  • consola
  • environment
  • files/plots

Trabajando con proyectos.

Directorio tipico:

1-get_data.R
2-process_data.R
3-analyze_data.R
4-make_graphs.R
data/
figures/

Guias de estilo

Da igual cual sigas, lo importante es tener uno I. Bartomeus

El mio es este El de google este

Resources

  • CRAN - The Comprehensive R Archive Network. Ground zero for R.
  • GitHub - The GitHub page.
  • RStudio - the integrated development environment for R. Makes many things easier.
  • Advanced R - the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. Detailed, in depth look at many of the issues covered here.

Resources

Resources

Más?

y el grupo de usuarios de R de Sevilla