O objetivo dessa predição, utilizando o método de Naive Bayes, se resume a determinar quanto o modelo é capaz de aprender a prever o rendimento anual de uma pessoa (<= 50K ou > 50K), ou seja, se uma pessoa ganha acima de 50K (> 50) ou ganha igual ou menos que 50 K (<=50) por ano.
Neste trabalho sobre Machine Learning (aprendizado de máquina supervisionado) farei uma pequena demonstração usando a plataforma analítica KNIME. Estarei criando um fluxo de trabalho KNIME que utiliza o método de Naive Bayes para treinar um modelo no conjunto de dados formação de adultos.
Neste fluxo utilizarei as operações de preparação, limpeza e manipulação de dados no conjunto de dados de treinamento adult.csv, este conjunto de dados pode ser encontrado no repositório de aprendizagem de máquina UCI, no link abaixo : http://archive.ics.uci.edu/ml/datasets/Adult -(Este conjunto de dados foi desenvolvido por Barry Becker e foi extraído do banco de dados do Censo americano de 1994.)