Skip to content

dadosdelaplace/hilostwitter

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

93 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Códigos R de los hilos de Twitter (R codes of Twitter threads)

License: GPLv3 lifecycle CRAN_Status_Badge Sígueme en Twitter (follow on Twitter)

Twitter Instagram Telegram Newsletter

 Bienvenido/a, aquí Javi (@DadosDeLaplace) 👋

PatreonPuedes contribuir al proyecto de divulgación estadística pagando dos cafés ☕️ en la comunidad Patreon

 

Códigos realizados en R que complementan los hilos de divulgación estadística y de visualización de datos en Twitter (@DadosDeLaplace) y los hilos de #MatesEnDomingo, principalmente realizados con los paquetes de {dplyr}, {ggplot2}, {lubridate}, {plotly} y {tidyr}, así como otros paquetes, principalmente del entorno {tidyverse}. También podrás encontrar algunos códigos que complementan la divulgación realizada en Instagram.

Siéntete libre de utilizar lo que aquí encuentres pero no se te olvide citarlo.

(formato de repositorio inspirado en diferentes partes de los repositorios de Tidyverse, Eduardo García-Portugués Moriah Taylor, Hadley Wickham, Yan Holtz y Cédric Scherer, y conversaciones con Gabriel Valverde, Alejandra López-Pérez y [Dominic Royé][https://twitter.com/dr_xeo])


R codes to complement my contributions on statistics and dataviz in Twitter Twitter (@DadosDeLaplace), and about the Twitter threads #MatesEnDomingo, mainly focused on packages {dplyr}, {ggplot2}, {lubridate}, {plotly} y {tidyr}, and other packages that are part of {tidyverse} environment. You'll also be able to access to some codes to complement my contributions in Instagram.

Feel free to use any of the contents but don't forget to cite them.


⚠️ ATRIBUCIÓN: debido a una polémica en Twitter, a colación de un gráfico en el que se me olvidó mencionar dentro del plot al autor de la idea, se ha incorporada dicha cita y revisado detenidamente que todas las citas a ideas, visualizaciones o datos estén, no solo debidamente citadas DENTRO de las gráficas (como siempre lo estuvieron), sino también en este readme, incluyendo los links a los repositorios de GitHub pertinentes así como sus redes sociales (en caso de poder encontrarlas o conocerlas, ya que no siempre llegan a mi conocimiento a través de Twitter). Mis disculpas públicas a las personas que pudieron verse afectadas por considerar que, amén de en el interior del gráfico, la cita debía estar visible otros lugares (como en el readme o en mención de Twitter). Cualquier conflicto en atribución, bien por olvido (sin ánimo de robar contenido ajeno) o bien porque hayamos hecho gráficas similares de forma paralela (sin conocimiento), se ruega mandar un mensaje por privado a la cuenta de Twitter para solventarlo lo antes posible como es debido.

DISCLAIMER:
⛔️ Los gráficos aquí generados NO llevan incorporada ningún tipo de edición fotografíca (no Illustrator or Photoshop was used).
📝 Los códigos aquí subidos están comentados en la medida de lo posible (codes are mostly commented).
💰 Todo el contenido es libre y gratuito siendo citado (all content is free but well cited is required).

Contribuciones en TWITTER de los hilos de #MatesEnDomingo (CLICK PARA ABRIR) / Contributions to #MatesEnDomingo (click to expand)
Otros hilos de TWITTER (CLICK PARA ABRIR) / Other contributions (click to expand)
Divulgación en INSTAGRAM (CLICK PARA ABRIR) / Contributions on Instagram (click to expand)

🧶 HILO EN TWITTER / TWITTER THREAD

⚠️ ATRIBUCIÓN: visualización adaptada del código de Alexandra Bagaïni. Link a su repositorio Github: https://github.com/abagaini/30DayChartChallenge/tree/main/2021/day_13

📊 DATOS: simulación propia (datos distintos a los usados del paquete {correlation} usado por Alexandra.

Paradoja de Simpson: datos agregados ofrecen conclusiones opuestas que el análisis desagregado por variable confusora (por grupo)

Datos agregados (generados con 4 normales bivariantes diferentes)

Datos desagagregados por grupos (generados con 4 normales bivariantes diferentes)

🧶 HILO EN TWITTER / TWITTER THREAD

⚠️ ATRIBUCIÓN: visualización adaptada del código de Cédric Scherer. Link a su repositorio Github: https://github.com/z3tt/TidyTuesday. Gráficos de radar inspirados en las visualizaciones de Dominic Royé mostradas por Twitter.

📊 DATOS: AEMET.

⚠️ IMPORTANTE: solo se muestran las gráficas de Madrid pero en el código R se explica como replicarlo con cualquier estación AEMET de España.

Distribución de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas

Scatter plot con la evolución de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas coloreadas por décadas

Scatter plot con la evolución de las temperaturas mínimas diarias (1960-2021) en la estación del AEMET Madrid-Barajas coloreadas por décadas

Gráfico de líneas con la evolución de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas (2021 en negro)

Gráfico de radar de las temperaturas máximas diarias (1960-2021) en la estación del AEMET Madrid-Barajas

🧶 HILO EN TWITTER / TWITTER THREAD

⚠️ ATRIBUCIÓN: la gráfica de ratings es una visualización adaptada del código de Cédric Scherer. Link a su repositorio Github: https://github.com/Z3tt/TidyTuesday/tree/master/plots/2020_12. Para el resto de gráficas no me he inspirado (al menos conscientemente) en ninguna otra visualización. De haber un conflicto de atribución, se ruega mandar un mensaje privado a Twitter lo antes posible solventarlo.

📊 DATOS: extraídos de los draft recopilados en https://www.randomservices.org/random/data/Draft.html

Gráfico de rating, que compara las papeletas de cada mes con el resto pero también con su media mensual: los que estén por encima de 195 fueron reclutados (el tamaño de los puntos depende de la media del número de papeleta de dicho mes)

Gráfico de puntos (scatter) + línea horizontal + líneas verticales (para visualizar mejor la desproporción por mes): meses en el eje x, número de la papeleta asociada a cada día del mes en el eje y

Calendario con los días reclutados marcados en rojo: los nacidos en esos días fueron llamados al frente

dsdasda Gráfico de barras horizontales del número de días reclutados por mes

Regresión mes vs número medio de papeleta por mes

Distribución mensual de las papeletas

Gráfico de cajas y bigotes + densidad + simulación Monte Carlo: simulamos 1000 draft distintos y guardamos como quedarían las papeletas a lo largo de los meses para ver lo extremo del resultado real


📸 INFOGRAFÍA EN INSTAGRAM / CONTRIBUTION ON INSTAGRAM

⚠️ ATRIBUCIÓN: no me he inspirado (al menos conscientemente) en ninguna otra visualización. De haber un conflicto de atribución, se ruega mandar un mensaje privado a Twitter lo antes posible solventarlo.

📊 DATOS: simulación propia.

Probabilidad de saberse {0, 1, 2, 3, 4, 5} temas en unas oposiciones de 71 temas y 5 bolas

Probabilidad de saberse al menos {0, 1, 2, 3, 4, 5} temas en unas oposiciones de 71 temas y 5 bolas


⚠️ ATRIBUCIÓN: el gráfico del datasaurus está inspirado en el experimento generado por Alberto Cairo. El resto de gráficos no me he inspirado (al menos conscientemente) en ninguna otra visualización. De haber un conflicto de atribución, se ruega mandar un mensaje privado a Twitter lo antes posible solventarlo.

📊 DATOS: obtenidos de los paquetes {datasets} y {datasauRus}

🧶 HILO EN TWITTER / TWITTER THREAD

Cajas y bigotes de las 4 variables X

Cajas y bigotes de las 4 variables X con el scatter de los datos

Cajas y bigotes de las 4 variables X con el scatter de los datos y las funciones de densidad

Cajas y bigotes de las 4 variables Y con el scatter de los datos y las funciones de densidad

Cuarteto de Anscombre: cuatro pares de datos (X, Y) con misma media, desviación típica y misma recta de regresión en su ajuste

Conjunto «Datasaurus dozen»: todos los pares de puntos tienen la misma media, misma desviación típica y misma recta de regresión en su ajuste


🧶 HILO EN TWITTER / TWITTER THREAD

⚠️ ATRIBUCIÓN: no me he inspirado (al menos conscientemente) en ninguna otra visualización. De haber un conflicto de atribución, se ruega mandar un mensaje privado a Twitter lo antes posible solventarlo.

📊 DATOS: simulación propia.

Distribuciones normales (campanas de Gauss) para diferentes medias y desviaciones típicas

Número de caras obtenidas al repetir 1000 veces el experimento de tirar 2 veces una moneda

Número de caras obtenidas al repetir 1000 veces el experimento de tirar 12 veces una moneda

Número de caras obtenidas al repetir 1 000 000 veces el experimento de tirar 300 veces una moneda trucada, para distintas probabilidades de sacar cara (15%-50%-70%-90%)

Suma de las tiradas de un dado obtenidas al repetir 1 000 000 veces el experimento de tirar 10 veces un dado

Teorema central del límite: media de 2-5-10-20-50 variables aleatorias normales

Teorema central del límite: media de 2-5-10-20-50 variables aleatorias uniformes

Teorema central del límite: media de 2-5-10-20-50 variables aleatorias binomiales

Teorema central del límite: media de 2-5-10-20-50 variables aleatorias exponenciales

Teorema central del límite: media de 2-5-10-20-50 variables aleatorias de Poisson


🧶 HILO EN TWITTER / TWITTER THREAD 📸 INFOGRAFÍA EN INSTAGRAM / CONTRIBUTION ON INSTAGRAM

⚠️ ATRIBUCIÓN: visualización adaptada del código de Cédric Scherer. Link a su repositorio Github: https://github.com/z3tt/TidyTuesday#week-202014--beer-production-by-ttb. La gráfica se publicó erróneamente sin citar la fuente original del diseño de la gráfica en el cual me basé y adapté, error grave por el que pido las disculpas públicas pertinentes (y así lo hago constar públicamente en este repositorio).

📊 DATOS: recopilación propia a partir de los seguidores de Instagram y Twitter.

Ley de Benford: distribución de frecuencias del primer dígito en páginas aleatorias de libros

Ley de Benford: distribución de frecuencias del primer dígito de los casos diarios covid en cada provincia