Este proyecto se corresponde a la segunda PRA de la asignatura Tipología y ciclo de vida de los datos del Máster en Ciencia de Datos de la UOC.
En esta segunda practica se desea, partiendo de un dataset obtenido en Kaggle, realizar la limpieza y el análisis de los datos de forma que apliquemos los conocimientos obtenidos a lo largo de la asignatura. Así mismo, se desea obtener conclusiones en base a dicho analisis y que el proceso se siga conforme a lo que corresponde a un proyecto de ciencia de datos.
La práctica ha sido realizada por completo por el alumno Rubén Moya Vázquez.
En este apartado cabe destacar que hay varios tipos de ficheros distribuidos en carpetas.
En la carpeta code encontramos:
- star_cleaner.rmd: Fichero de ejecución de R con el código utilizado para realizar nuestra practica.
- star_cleaner.html: Reporte generado automaticamente por RStudio.
- PEC_header.html: Cabecera utilizada para el reporte.
En la carpeta data encontramos:
- 6_class_csv.csv: Fichero csv obtenido de https://www.kaggle.com/deepu1109/star-dataset
- clean_data.csv: Nuestro fichero con los datos tratados.
En la carpeta docs encontramos:
- PRA2_rmoyav.pdf: Documento de la entrega.
- PRA2.mp4: Video-explicación del proyecto.
README.md: Este fichero que describe el proyecto de manera superficial.