Este repositório contém os arquivos desenvolvidos pelo Grupo 97 para o desafio do Datathon.
base.csv
: Base de dados fornecida pela organização do Datathon.Datathon_Grupo_97.ipynb
: Notebook Jupyter contendo todo o processo de análise, tratamento de dados, modelagem e geração da submissão.submissao.csv
: Arquivo final submetido com as previsões do modelo.
O objetivo do desafio foi utilizar dados fornecidos para construir um modelo preditivo que gerasse resultados com base em critérios definidos pela organização do Datathon.
- Exploração e análise da base de dados
- Limpeza e tratamento de dados
- Criação de variáveis e engenharia de features
- Treinamento e avaliação de modelos preditivos
- Geração do arquivo de submissão
- Python 3.8 ou superior
- Bibliotecas principais:
- pandas
- numpy
- scikit-learn
- matplotlib
- seaborn
- xgboost
As dependências podem ser instaladas via
pip install -r requirements.txt
(arquivo não incluído, mas pode ser gerado com base no notebook).
- Abra o arquivo
Datathon_Grupo_97.ipynb
em um ambiente Jupyter Notebook. - Execute as células sequencialmente para reproduzir as análises e gerar a submissão.