Código de la Unidad 6 de la asignatura Programación Python para Data Science del Máster Universitario de Ciencia de Datos (Data Science).
Borja Villena Pardo
Archivo de entrega prog_datasci_6_preproc_entrega.ipynb
Ejecutar prog_datasci_6_preproc_entrega.ipynb en entorno Jupyter NoteBook, Anaconda Navigator o Google Colab.
Esta unidad presenta las principales herramientas de preprocesamiento de datos en Python. Veremos cómo utilizar la librería pandas, que ya hemos introducido en los módulos anteriores, para preprocesar datos, y también introduciremos el uso de una nueva librería, scikit-learn. A continuación se incluye la tabla de contenidos:
- El preprocesamiento de datos
- Preprocesamiento de datos en Python
- Integración de datos
- Transformación de datos
- Limpieza de datos
- Normalización de datos
- Reducción de dimensiones
- Reducción de muestras