Skip to content

Projeto com o intuito de analisar os dados "German Credita Data" do repositório de ML da UCI, para exploração dos dados, criação de um modelo simples de classificação de bons e maus pagadores e como uma melhor seleção de variáveis pode aumentar a eficácia do modelo.

Notifications You must be signed in to change notification settings

bicudorafa/Projeto_R_GermanCreditRisk

Repository files navigation

Projeto_R_GermanCreditRisk

Projeto com o intuito de entender os dados sobre qualidade de crédito (German Credita Data - (https://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/german.data), através de uma análise exploratória, criação de um modelo simples de classificação de bons e maus pagadores e demonstrando como uma melhor seleção de variáveis pode aumentar a eficácia dos preditores, além de fazer uso de alguns dos melhores algorítmos de classificação aliados à otimização de seus hiper parâmetros.

Instruções

A análise foi feita em R, através do RStudio, com a utilização dos principais pacotes do conjunto Tidyverse. Vale ressaltar, também, o uso do Caret para as análises de aprendizado de máquina, juntamente a outros pacotes necessários por este (checar documentação do pacote no GitHub). O estilo de programação é bem similar ao recomendado pelo Google.

Orientações

O trabalho possui 6 arquivos: o script usado para gerar os objetos e com anotações relevantes ao desenvolvimento e próximos passos, um Rmd com o esqueleto do relatório , esse em si em formato pdf e o Rproj usado para organizar o projeto no RStudio.

About

Projeto com o intuito de analisar os dados "German Credita Data" do repositório de ML da UCI, para exploração dos dados, criação de um modelo simples de classificação de bons e maus pagadores e como uma melhor seleção de variáveis pode aumentar a eficácia do modelo.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages