author: I. Bartomeus date: Nov 2016 autosize: true
- Introducción (yo hablando; 45')
- Programación en R (yo) + Visualización de datos (Paco)
- Modelos mixtos (yo) + Modelos nulos (yo)
- Bayesiano (Paco) + Simulaciones (yo)
- Multivariante (yo) + git (Paco)
- GIS (Paco) + "a jugar" (Paco y yo)
Feedback: Email: nacho.bartomeus@gmail.com
- Cursos de R online y libros hay a patadas.
- Aquí venimos a equivocarnos cuanto más mejor
- Resolveremos cuantos más problemas mejor
- Sistema de posit it para los ejercicios.
- Entender las ventajas de usar R (o otros lenguages de programación)
- Que descubrais que con R se puede hacer casi todo (desde esta presentación hasta pedir pizza)
- Saber suficiente R para poder "googlear" lo que necesiteis aprender/resolver a partir de ahora.
- Download R
- R desde Rstudio (download Rstudio)
- Material del curso
- Carpeta 'ejercicios' y 'ejercicios_resueltos'
- StackOverflow
- How do I ask a good question?
- Google (e.g. error message + r)
Baremo del problema:
- consulta (hasta 5 pestañas abiertas)
- problema (hasta 10 pestañas abiertas)
- marrón (> 10 pestañas)
R has simple and obvious appeal. Through R, you can sift through complex data sets, manipulate data through sophisticated modeling functions, and create sleek graphics to represent the numbers, in just a few lines of code...R’s greatest asset is the vibrant ecosystem has developed around it: The R community is constantly adding new packages and features to its already rich function sets.
No siempre. R tiene limitaciones y debilidades:
- Curva de aprendizage; syntaxis incosistente
- Documentación fragmentada (?help, vignettes, etc...)
- Calidad de los paquetes varia
- No esta diseñado para grandes bases de datos (~100 Mb de csv)
Hay otras herramientas:
- Julia, Python, C++, bash, ...
- Excel? Casi nunca.
It’s important to make a workflow that you can use time and time again, and even pass on to others in such a way that you don’t have to be there to walk them through it. Source
Your closest collaborator is you 6 months ago, and you don't respond to emails. P. Wilson
Interested: read our paper
...Lo que no existe.
- Gozilla se ha comido mi ordenador
- backup
- idealmente de forma continua
- Godzilla se ha comido mi oficina
- cloud
...lo que has perdido. Y si necesitas un archivo que existio hace 1, 10 o 100 dias?
- Incremental backups (minimo)
- Version control (mejor). Git (y GitHub) es el más popular
- Es una ciencia dinámica.
- Es una ciencia compleja y con diversas filosofias.
- Es una herramienta, no un fin.
- No puede solucionar malos datos (e.g. baja replicación).
- No puede solucionar un mal diseño experimental.
- scripts
- consola
- environment
- files/plots
Directorio tipico:
1-get_data.R
2-process_data.R
3-analyze_data.R
4-make_graphs.R
data/
figures/
Da igual cual sigas, lo importante es tener uno I. Bartomeus
El mio es este El de google este
- CRAN - The Comprehensive R Archive Network. Ground zero for R.
- GitHub - The GitHub page.
- RStudio - the integrated development environment for R. Makes many things easier.
- Advanced R - the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. Detailed, in depth look at many of the issues covered here.
- CRAN task views resumenes de tareas (e.g. Bayesiano)
- e.g. Reproducible Research
- RopenScience. Paquetes brutales para hacer ciencia abierta
- Quick-R: Donde yo voy ha consultar las recetas (PCA's, glm's, etc...)
- Cursos para empezar: *r for cats *r-bio *datacamp