Descripción: En este taller los estudiantes desarrollaran habilidades de análisis de datos y visualización de información. Se ulizará Python con el framework Anaconda y las librerías Pandas y Matplotlib
Requisitos de entrada: Conocimientos básicos de programación (IWI-131)
Competencias Específicas del Perfil de Egreso a las que contribuye:
- Modelos y métodos: Diseña y aplica métodos estadíscos para el análisis y la interpretación de datos y el diseño de experimentos computacionales.
- Modelos y métodos: Aprende a enfrentar y proponer soluciones usando estrategias algorítmicas en problemas complejos
Competencias Transversales del Perfil de Egreso a las que contribuye:
- Comunicar información oral y escrita de manera eficaz al interior de las organizaciones en las que se desempeña, como con endades del entorno.
- Actuar con autonomía, flexibilidad, iniciava, y pensamiento críco al enfrentar problemácas de la profesión .
Objetivos (Resultados del aprendizaje): Al aprobar la asignatura, el estudiante será capaz de:
- Extraer conjuntos de datos (datasets) desde laweb
- Aplicar técnicas de limpieza dedatos
- Aplicar distintas técnicas de visualización deinformación
- Conocer aplicaciones de análisis y visualización de información en laindustria
- Presentar de manera oral y escrita trabajo de análisis sobre un determinadodataset.
Metodología de enseñanza y de aprendizaje:
- Clases exposivas, material de apoyo teórico disponible para leer después de clases.
- Se presentan ejemplos en la industria para mostrar como el análisis de datos y visualización de información logran resolver problemas actuales.
- En el informe preliminar el estudiante debe dar a conocer el dataset que ulizará en el trabajo final junto con las preguntas que intentará responder.
- En el trabajo final el alumno debe extraer información valiosa desde un dataset de su elección, manejando los datos con Pandas y visualizando los resultados con Matplotlib. Los resultados son reportados en un informe escrito y en una presentación.
Evaluación:
- Se exige un mínimo de 80% de asistencia al taller. Una vez cumplido, la nota se calcula como se explica a connuación:
- Nota final = 30%Asistencia + 5% Informe Preliminar + 65%* Trabajo Final (40% Presentación + 60% Informe Escrito)
Programación semestre
Sesión Nº | Nombre | Tipo Actividad |
---|---|---|
1 | Introducción y motivación al taller. | Clase teórico-práctica Ejemplo de cómo Data Science logra solucionar problemas (Open Street Map yRed de transporte) |
2 | Introducción a Pandas | Clase teórico-práctica Instalación de librería, manejo de objetos y missing values en Pandas. |
3 | Extracción de datasets desde la web | Clase teórico-práctica Extracción de información desde sitios web usando Python + Pandas |
4 | Limpieza de datos con Pandas | Clase teórico-práctica Data Munging. Unión de datasets con Pandas |
5 | Introducción a la visualización de información | Clase teórico-práctica Introducción a Matplotlib. Gráficos de línea y dispersión. Visualización de errores en gráficos. |
6 | ¿Cuál es el gráfico correcto para mis datos? | Clase teórico-práctica Gráficos de densidad y contorno.Histogramas. Personalización de figuras. |
7 | Visualización de información geoespacial | Clase teórico-práctica Visualización de data con BaseMap (data geográfica) y Seaborn. |
8 | Ejemplo Práctico I | Clase teórico-práctica Trabajando con la encuesta de viajes(origen-destino), Santiago 2012 |
9 | Ejemplo Práctico II | Clase teórico-práctica Trabajando con la encuesta CASEN Entrega de informe preliminar |
10 | Sesión final | Clase práctica Presentaciones del trabajo final.Cierre del taller. |
Este curso está basado en el gran trabajo de Phd. Eduardo Graells (https://github.com/carnby/uddvis)