Códigos realizados en R que complementan los hilos de divulgación estadística y de visualización de datos en Twitter (@DadosDeLaplace) y los hilos de #MatesEnDomingo, principalmente realizados con los paquetes de {dplyr}
, {ggplot2}
, {lubridate}
, {plotly}
y {tidyr}
, así como otros paquetes, principalmente del entorno {tidyverse}
. También podrás encontrar algunos códigos que complementan la divulgación realizada en Instagram.
Siéntete libre de utilizar lo que aquí encuentres pero no se te olvide citarlo.
(formato de repositorio inspirado en diferentes partes de los repositorios de Tidyverse, Eduardo García-Portugués Moriah Taylor, Hadley Wickham, Yan Holtz y Cédric Scherer, y conversaciones con Gabriel Valverde, Alejandra López-Pérez y [Dominic Royé][https://twitter.com/dr_xeo])
R codes to complement my contributions on statistics and dataviz in Twitter Twitter (@DadosDeLaplace), and about the Twitter threads #MatesEnDomingo, mainly focused on packages {dplyr}
, {ggplot2}
, {lubridate}
, {plotly}
y {tidyr}
, and other packages that are part of {tidyverse}
environment. You'll also be able to access to some codes to complement my contributions in Instagram.
Feel free to use any of the contents but don't forget to cite them.
DISCLAIMER:
⛔️ Los gráficos aquí generados NO llevan incorporada ningún tipo de edición fotografíca (no Illustrator or Photoshop was used).
📝 Los códigos aquí subidos están comentados en la medida de lo posible (codes are mostly commented).
💰 Todo el contenido es libre y gratuito siendo citado (all content is free but well cited is required).
Contribuciones en TWITTER de los hilos de #MatesEnDomingo (CLICK PARA ABRIR) / Contributions to #MatesEnDomingo (click to expand)
- #MatesEnDomingo 2021
- #MatesEnDomingo 2020
Otros hilos de TWITTER (CLICK PARA ABRIR) / Other contributions (click to expand)
- Contribuciones (contributions) 2021
Divulgación en INSTAGRAM (CLICK PARA ABRIR) / Contributions on Instagram (click to expand)
- Contribuciones (contributions) 2021
🧶 HILO EN TWITTER / TWITTER THREAD
📊 DATOS: simulación propia (datos distintos a los usados del paquete {correlation}
usado por Alexandra.
Paradoja de Simpson: datos agregados ofrecen conclusiones opuestas que el análisis desagregado por variable confusora (por grupo)
Datos agregados (generados con 4 normales bivariantes diferentes)
Datos desagagregados por grupos (generados con 4 normales bivariantes diferentes)
30/06/2021 🌡 Evolución de las temperaturas máximas (1960-2021) en diferentes capitales de provincia / Daily max temperatures (1960-2021) of some Spanish cities
🧶 HILO EN TWITTER / TWITTER THREAD
📊 DATOS: AEMET.
Distribución de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas
Scatter plot con la evolución de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas coloreadas por décadas
Scatter plot con la evolución de las temperaturas mínimas diarias (1960-2021) en la estación del AEMET Madrid-Barajas coloreadas por décadas
Gráfico de líneas con la evolución de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas (2021 en negro)
Gráfico de radar de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas
🧶 HILO EN TWITTER / TWITTER THREAD
📊 DATOS: extraídos de los draft recopilados en https://www.randomservices.org/random/data/Draft.html
Gráfico de rating, que compara las papeletas de cada mes con el resto pero también con su media mensual: los que estén por encima de 195 fueron reclutados (el tamaño de los puntos depende de la media del número de papeleta de dicho mes)
Gráfico de puntos (scatter) + línea horizontal + líneas verticales (para visualizar mejor la desproporción por mes): meses en el eje x, número de la papeleta asociada a cada día del mes en el eje y
Calendario con los días reclutados marcados en rojo: los nacidos en esos días fueron llamados al frente
Gráfico de barras horizontales del número de días reclutados por mes
Regresión mes vs número medio de papeleta por mes
Distribución mensual de las papeletas
Gráfico de cajas y bigotes + densidad + simulación Monte Carlo: simulamos 1000 draft distintos y guardamos como quedarían las papeletas a lo largo de los meses para ver lo extremo del resultado real
📸 INFOGRAFÍA EN INSTAGRAM / CONTRIBUTION ON INSTAGRAM
📊 DATOS: simulación propia.
Probabilidad de saberse {0, 1, 2, 3, 4, 5} temas en unas oposiciones de 71 temas y 5 bolas
Probabilidad de saberse al menos {0, 1, 2, 3, 4, 5} temas en unas oposiciones de 71 temas y 5 bolas
📊 DATOS: obtenidos de los paquetes {datasets}
y {datasauRus}
🧶 HILO EN TWITTER / TWITTER THREAD
Cajas y bigotes de las 4 variables X
Cajas y bigotes de las 4 variables X con el scatter de los datos
Cajas y bigotes de las 4 variables X con el scatter de los datos y las funciones de densidad
Cajas y bigotes de las 4 variables Y con el scatter de los datos y las funciones de densidad
Cuarteto de Anscombre: cuatro pares de datos (X, Y) con misma media, desviación típica y misma recta de regresión en su ajuste
Conjunto «Datasaurus dozen»: todos los pares de puntos tienen la misma media, misma desviación típica y misma recta de regresión en su ajuste
🧶 HILO EN TWITTER / TWITTER THREAD
📊 DATOS: simulación propia.
Distribuciones normales (campanas de Gauss) para diferentes medias y desviaciones típicas
Número de caras obtenidas al repetir 1000 veces el experimento de tirar 2 veces una moneda
Número de caras obtenidas al repetir 1000 veces el experimento de tirar 12 veces una moneda
Número de caras obtenidas al repetir 1 000 000 veces el experimento de tirar 300 veces una moneda trucada, para distintas probabilidades de sacar cara (15%-50%-70%-90%)
Suma de las tiradas de un dado obtenidas al repetir 1 000 000 veces el experimento de tirar 10 veces un dado
Teorema central del límite: media de 2-5-10-20-50 variables aleatorias normales
Teorema central del límite: media de 2-5-10-20-50 variables aleatorias uniformes
Teorema central del límite: media de 2-5-10-20-50 variables aleatorias binomiales
Teorema central del límite: media de 2-5-10-20-50 variables aleatorias exponenciales
Teorema central del límite: media de 2-5-10-20-50 variables aleatorias de Poisson
🧶 HILO EN TWITTER / TWITTER THREAD 📸 INFOGRAFÍA EN INSTAGRAM / CONTRIBUTION ON INSTAGRAM
📊 DATOS: recopilación propia a partir de los seguidores de Instagram y Twitter.
Ley de Benford: distribución de frecuencias del primer dígito en páginas aleatorias de libros
Ley de Benford: distribución de frecuencias del primer dígito de los casos diarios covid en cada provincia