Desenvolver uma rede neural perceptron multicamadas capaz de prever a pontuação de uma entrada avaliada publicamente online, através de seus dados.
Os dados foram coletados utilizando uma versão simplificada do scrapper dataset, convertida para a linguagem dart
.
A filtragem dos dados é efetuada para manter apenas entradas que possuem dados válidos, visto que o objetivo é observar a relação entre estes valores e a pontuação da entrada.
Todos os dados vêm desta plataforma, onde usuários podem cadastrar novas entradas e votar nestas.
A pontuação é calculada através de Laplace smoothing ¹, uma técnica que gera um valor de 0 à 1 tomando em consideração a quantidade de votos totais e também o quantitativo de votos positivos. Uma alternativa seria o uso do limite inferior do intervalo de confiança da pontuação de Wilson para um parâmetro de Bernoulli ².
Esta técnica não foi utilizada, todavia, porque o nível de complexidade não justifica o ganho em precisão, para o caso aplicado. Para melhor entendimento, o artigo How to Count Thumb-Ups and Thumb-Downs: User-Rating based Ranking of Items from an Axiomatic Perspective ³ demonstra a validade do método Laplace smoothing.
Após implementação, tornou-se perceptível que é de maior interesse observar a quantia de likes e dislikes, deste modo, a atribuição de pontuação foi descartada.
Além disso, com o desenvolvimento da rede neural foi possível observar que a base de dados selecionada não possui um padrão explícito, possivelmente causado pela alta diversidade dos usuários que originaram o conjunto de dados, deste modo, as previsões efetuadas, na maioria das vezes, indicam um número balanceado de likes e dislikes em pequena quantidade, o que está de acordo com a maioria dos dados estudados.
[1] How To Sort By Average Rating
[2] How Not To Sort By Average Rating
- Acesso em 11/12/2021