Skip to content

Latest commit

 

History

History
64 lines (48 loc) · 3.97 KB

File metadata and controls

64 lines (48 loc) · 3.97 KB

Data Analysis and Visualization with Python

Taller de manejo y visualización de datos con Python

Descripción: En este taller los estudiantes desarrollaran habilidades de análisis de datos y visualización de información. Se ulizará Python con el framework Anaconda y las librerías Pandas y Matplotlib

Requisitos de entrada: Conocimientos básicos de programación (IWI-131)

Competencias Específicas del Perfil de Egreso a las que contribuye:

  1. Modelos y métodos: Diseña y aplica métodos estadíscos para el análisis y la interpretación de datos y el diseño de experimentos computacionales.
  2. Modelos y métodos: Aprende a enfrentar y proponer soluciones usando estrategias algorítmicas en problemas complejos

Competencias Transversales del Perfil de Egreso a las que contribuye:

  1. Comunicar información oral y escrita de manera eficaz al interior de las organizaciones en las que se desempeña, como con endades del entorno.
  2. Actuar con autonomía, flexibilidad, iniciava, y pensamiento críco al enfrentar problemácas de la profesión .

Objetivos (Resultados del aprendizaje): Al aprobar la asignatura, el estudiante será capaz de:

  1. Extraer conjuntos de datos (datasets) desde laweb
  2. Aplicar técnicas de limpieza dedatos
  3. Aplicar distintas técnicas de visualización deinformación
  4. Conocer aplicaciones de análisis y visualización de información en laindustria
  5. Presentar de manera oral y escrita trabajo de análisis sobre un determinadodataset.

Metodología de enseñanza y de aprendizaje:

  1. Clases exposivas, material de apoyo teórico disponible para leer después de clases.
  2. Se presentan ejemplos en la industria para mostrar como el análisis de datos y visualización de información logran resolver problemas actuales.
  3. En el informe preliminar el estudiante debe dar a conocer el dataset que ulizará en el trabajo final junto con las preguntas que intentará responder.
  4. En el trabajo final el alumno debe extraer información valiosa desde un dataset de su elección, manejando los datos con Pandas y visualizando los resultados con Matplotlib. Los resultados son reportados en un informe escrito y en una presentación.

Evaluación:

  1. Se exige un mínimo de 80% de asistencia al taller. Una vez cumplido, la nota se calcula como se explica a connuación:
  2. Nota final = 30%Asistencia + 5% Informe Preliminar + 65%* Trabajo Final (40% Presentación + 60% Informe Escrito)

Programación semestre

Sesión Nº Nombre Tipo Actividad
1 Introducción y motivación al taller. Clase teórico-práctica Ejemplo de cómo Data Science logra solucionar problemas (Open Street Map yRed de transporte)
2 Introducción a Pandas Clase teórico-práctica Instalación de librería, manejo de objetos y missing values en Pandas.
3 Extracción de datasets desde la web Clase teórico-práctica Extracción de información desde sitios web usando Python + Pandas
4 Limpieza de datos con Pandas Clase teórico-práctica Data Munging. Unión de datasets con Pandas
5 Introducción a la visualización de información Clase teórico-práctica Introducción a Matplotlib. Gráficos de línea y dispersión. Visualización de errores en gráficos.
6 ¿Cuál es el gráfico correcto para mis datos? Clase teórico-práctica Gráficos de densidad y contorno.Histogramas. Personalización de figuras.
7 Visualización de información geoespacial Clase teórico-práctica Visualización de data con BaseMap (data geográfica) y Seaborn.
8 Ejemplo Práctico I Clase teórico-práctica Trabajando con la encuesta de viajes(origen-destino), Santiago 2012
9 Ejemplo Práctico II Clase teórico-práctica Trabajando con la encuesta CASEN Entrega de informe preliminar
10 Sesión final Clase práctica Presentaciones del trabajo final.Cierre del taller.

Este curso está basado en el gran trabajo de Phd. Eduardo Graells (https://github.com/carnby/uddvis)