Skip to content

Materiais da Especialização de Ciência de Dados na UNIFACISA

Notifications You must be signed in to change notification settings

tarcisobraz/ufc_data_science

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 

Repository files navigation

Pré-processamento de Dados - Ciência de Dados UNIFACISA

Índice

  1. Instalação
  2. Motivação
  3. Estrutura e Arquivos
  4. Licença, Autores e Créditos

Instalação

O código assume que você usa Anaconda (Python 3) com as bibliotecas da instalação padrão.

Motivação

O objetivo desse repositório é abrigar o código e dados utilizados na ministração da disciplina de Pré-processamento de Dados na Especialização de Ciência de Dados da UNIFACISA.

A disciplina cobriu os seguintes tópicos:

  • Preparando do Ambiente
  • Acessando os Dados
  • Conhecendo os Dados
    • Tipos de Dado
    • Análise Exploratória
  • Preparando os Dados
    • Validação do Dado
    • Lidando com Problemas no Dado
      • Dados Faltantes (Missing Data)
      • Dados Destoantes (Outliers)
  • Transformando os Dados
    • Uniformização do Dado
      • Normalização e Estandardização
    • Redução de Dimensionalidade
    • Agrupamento

Estrutura e Arquivos

A pasta notebooks contém os notebooks Jupyter com o código usado nas seções práticas das aulas para cada assunto. A pasta dados contém os dados usados nas seções práticas das aulas para cada assunto.

Licença, Autores e Créditos

Os datasets famosos dos Índios Pima e do Titanic foram obtidos em UCI Machine Learning Repository e Kaggle respectivamente.

Informações de Descrição e Licença do dado podem ser encontradas nos links acima.

Os dados de autores e documentos da Câmara e Senado Federal foram extraídos das APIs de Dados Abertos de cada casa legislativa utilizando o pacote leggoR.

Boa parte do código foi feita com base em exemplos encontrados em sites como o TowardsDataScience.

Sinta-se à vontade para usar o código assim como contribuir.

About

Materiais da Especialização de Ciência de Dados na UNIFACISA

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published