Trabalho Prático 2 da disciplina de Ciência de Dados - UFC 2021.1 feito no Google Colab. Colocamos em um repositório para facilitar o acesso e a correção.
Separamos este trabalho em três partes (três Jupyter Notebooks):
-
Parte 1. Análise Exploratória & Pré-Processamento dos Dados
Nesta parte, visualizamos os dados e realizamos o pré-processamento deles de forma que sirvam de entrada para os modelos, seguindo os seguintes passos:
- Análise dos atributos.
- Busca de relações considerando vários atributos.
- Remoção de atributos redundantes.
- Conversão de atributos em uma forma adequada para os modelos.
-
Parte 2. Tarefas de Regressão e Classificação
Aqui, criamos/otimizamos diferentes modelos para as tarefas de Regressão e Classificação.
-
Parte 3. Avaliação Final das Tarefas de Regressão e Classificação
Por fim, realizamos uma comparação final das tarefas de Regressão e Classificação. As considerações finais sobre todo o trabalho também estão nesta parte.
Use o virtualenv
para criar um ambiente Python.
virtualenv venv --python=python3
source venv/bin/activate
Use o package manager pip
para instalar os pacotes necessários através do comando abaixo.
pip install -r requirements.txt
Depois, basta executar:
jupyter notebook
Em seguida, clique nos arquivos:
- 1 - Data Analysis and Data Preprocessing.ipynb para a Parte 1.
- 2 - Predictions for Regression and Classification Tasks.ipynb para a Parte 2.
- 3 - Final Evaluation for Regression and Classification Tasks.ipynb para a Parte 3.
- Alunos de Pós-Graduação em Ciência da Computação (MDCC/UFC): Bárbara Neves, Lucas Benjamim e Samir Braga; e,
- Aluno de Graduação em Ciência da Computação: Vinicius Bernardo.