Este repositorio contiene cuadernos Jupyter y conjuntos de datos para tareas de análisis y procesamiento de datos relacionadas con el informe de felicidad en varios países a lo largo de los años. Los datos provienen de dos fuentes principales: "world-happiness-report-2021.csv" y "world-happiness-report.csv".
El tema central de este repositorio es analizar el índice de felicidad en diferentes países a lo largo de los años y responder a una serie de preguntas específicas utilizando las herramientas aprendidas durante el módulo de Big Data Processing. Las preguntas incluyen:
-
¿Cuál es el país más "feliz" del 2021 según los datos? Considerando que la columna "Ladder score" tiene un mayor número para países más felices.
-
¿Cuál es el país más "feliz" del 2021 por continente según la data? Para analizar la felicidad en diferentes continentes.
-
¿Cuál es el país que más veces ocupó el primer lugar en todos los años? Identificando el país con el índice de felicidad más alto de manera recurrente.
-
¿Qué posición en el índice de felicidad tiene el país con el mayor GDP en 2020? Relacionando el GDP con el índice de felicidad.
-
¿En qué porcentaje ha variado el GDP promedio a nivel mundial del 2020 al 2021? ¿Aumentó o disminuyó? Analizando la variación en el GDP promedio global.
-
¿Cuál es el país con la mayor expectativa de vida ("Healthy life expectancy at birth")? ¿Cuál era ese indicador en 2019? Identificando el país con la expectativa de vida más alta y comparándola con datos anteriores.
-
Jupyter Notebook: Explora el cuaderno de Jupyter en este repositorio para llevar a cabo el análisis de los datos y responder a las preguntas mencionadas. Este cuaderno contiene el código, explicaciones y visualizaciones que facilitarán la comprensión y el trabajo con los conjuntos de datos.
-
Datasets: El directorio
Datasets
contiene los datos utilizados en los cuadernos Jupyter. Puedes utilizar estos conjuntos de datos para practicar tareas de procesamiento y análisis de datos. -
"Explorando el Mundo del Big Data": Puedes leer el artículo publicado en Medium donde explico las conclusiones, ideas y lecciones principales aprendidas durante este módulo.
-
Main-insights-and-learnings: En esta carpeta se organizan los principales insights y lecciones que se han trabajado durante el módulo con el fin de reforzar el contenido del artículo anterior.
- Clona o descarga este repositorio en tu máquina local.
- Abre el cuaderno Jupyter utilizando Jupyter Notebook o Jupyter Lab.
- Ejecuta el cuaderno para explorar y llevar a cabo tareas de procesamiento de datos.
- Personaliza el cuaderno o utiliza los conjuntos de datos proporcionados para tus propios proyectos de análisis de datos.
Las contribuciones a este repositorio son bienvenidas. Si tienes cuadernos Jupyter, conjuntos de datos o mejoras para el contenido existente, considera crear una solicitud de extracción.
Si tienes preguntas o necesitas ayuda, no dudes en ponerte en contacto conmigo.
¡Feliz procesamiento de datos! 😊