O projeto visa avaliar algoritmos para classificação supervisionada. A base dados utilizada é disponibilizada no kaggle, a qual consiste em um conjunto de pequenos textos em inglês, escritos ou por um programa de IA ou por um estudante.
O projeto usa uma distribuição de 70% treinamento e 30% teste, utilizamos os seguintes classificadores para a tarefa:
- LDA;
- QDA;
- K-NN;
- SVM;
- Random Forest.
Por fim, usamos métricas como ROC e AUC para indicar a precisão de cada classificador.