Projeto com o intuito de entender os dados sobre qualidade de crédito (German Credita Data - (https://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data), através de uma análise exploratória, criação de um modelo simples de classificação de bons e maus pagadores e demonstrando como uma melhor seleção de variáveis pode aumentar a eficácia dos preditores, além de fazer uso de alguns dos melhores algorítmos de classificação aliados à otimização de seus hiper parâmetros.
A análise foi feita em R, através do RStudio, com a utilização dos principais pacotes do conjunto Tidyverse. Vale ressaltar, também, o uso do Caret para as análises de aprendizado de máquina, juntamente a outros pacotes necessários por este (checar documentação do pacote no GitHub). O estilo de programação é bem similar ao recomendado pelo Google.
O trabalho possui 6 arquivos: o script usado para gerar os objetos e com anotações relevantes ao desenvolvimento e próximos passos, um Rmd com o esqueleto do relatório , esse em si em formato pdf e o Rproj usado para organizar o projeto no RStudio.