Skip to content

if1015-datascience-ufpe/syllabus

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

IF1015 — Introdução a Ciência dos Dados

Centro de InformáticaUniversidade Federal de Pernambuco

<style type="text/css"> ol { counter-reset: item } ol > li { display: block } ol > li:before { content: counters(item, ".") ". "; counter-increment: item } .figura_cabecalho {height: 80px} </style>

Ementa (Descrição da Disciplina)

Esta disciplina tem objetiva familiarizar o aluno com o novo paradigma científico centrado em dados. Serão apresentadas e discutidas técnicas para coleta, integração, visualização, pré-processamento e análise de dados, e comunicação de resultados. O aluno também será introduzido a técnicas básicas de aprendizado supervisionado, não-supervisionado e análise exploratória de dados. Na parte de visualização de dados, o foco será tanto nos aspectos interpretativos (uso de gráficos e figuras para análise de dados) quanto comunicativos (uso de elementos visuais para comunicar os resultados da análise). Para isso, serão apresentadas ferramentas e bibliotecas para visualização de gráficos. Finalmente, serão abordados conceitos de ética e privacidade no contexto de big data e ciência dos dados.

Conteúdo programático

  1. O quarto paradigma científico: mudança do paradigma centrado em hipóteses para o centrado em dados
  2. O que é ciência dos dados?
  3. Big data e ciência dos dados
  4. Capacidades exigidas de um cientista de dados.
  5. O ecossistema de ciência dos dados
  6. Coleta e pré-processamento de dados
  7. Coleta de dados online -- data scraping -- (Web, APIs, tipos/formatos de dados)
  8. Pré-processamento (limpeza, normalização, seleção de atributos e amostras)
  9. Análise exploratória de dados:
  10. Conceitos de análise exploratória
  11. Estatísticas descritivas (revisão de conceitos e implementações em R e Python)
  12. Visualização de dados (tipos de gráficos/dados, por que visualizar, ferramentas para construção de gráficos estáticos, dinâmicos e interativos)
  13. Introdução a mineração de dados (aprendizado supervisionado/não-supervisionado)
    1. Aprendizado estatístico (Regressão Linear/Logística)
    2. Classificação (árvores de decisão, naive Bayes, k nearest neighbors)
    3. Agrupamento (k-means, agrupamento hierárquico)
    4. Mineração de padrões frequentes (regras de associação)
    5. Medidas de interesse/qualidade (Acurácia, precisão-revocação, curva ROC)
  14. Ética e privacidade no contexto de big data e ciência dos dados

Bibliografia

Releases

No releases published

Packages

No packages published