Para esta entrega se necesitó realizar diversos puntos que consisten en la exploración y análisis de datos para poder extraer información útil y especifica de los mismos, en donde en una primera instancia, se utilizado la librería Pandas de Python para el análisis de datos y gráficos. Para la segunda parte de la entrega, dado a los grandes volúmenes de datos, se tuvo que utilizar la librera de Apache Spark para extraer la información necesaria.
En este caso se proporcionan los links y archivos a los Colab correspondientes de cada sección.
Links de Pandas:
Ejercicio 1: https://colab.research.google.com/drive/1WsLWhDNKZldEEpSVuC9OJqnMCHm_wxxb
Ejercicio 2: https://colab.research.google.com/drive/1xAAiwKMQABnSfvH12Vz1tGDpAeAzdUjG
Ejercicio 3: https://colab.research.google.com/drive/1hcBOmSrc-f0H_Se4VaEDUldBuEX9HKm8
Ejercicio 4: https://colab.research.google.com/drive/1eCvb9L3e1_RpBTxSOJ0qvqzyPj_fB2_b
Links de Gráficos:
Histograma: https://colab.research.google.com/drive/18vz1kuhRGF2MtNRc1At9iZmP_DENbJZx
Box Plot: https://colab.research.google.com/drive/1LuTaJmGlJBu3U66CENbqnlKJwkhZ_tIA
Heatmap: https://colab.research.google.com/drive/1phya3Hgx9dGlWHfxFY3lSDOd6fC68i6_
Links de Apache Spark:
Ejercicio 1: https://colab.research.google.com/drive/1fy7KAVYmHMdZ-fQYHUC4oDIe862zIYWh#scrollTo=aStouuCzPwLU
Ejercicio 2: https://colab.research.google.com/drive/1UHhsr52tgN1p6EsUnC-W7QAZEKZ-z-Ve
Ejercicio 3: https://colab.research.google.com/drive/1OQSQNBiiFUiIXC8kmiA6cOnuyFULvsM1
Ejercicio 4: https://colab.research.google.com/drive/1iafNUAQnK8z3giMZz9SsYDRMNvBOpcV5