Extração e Aplicação de Indicadores no Processo de Recomendação de Recursos Urbanos Utilizando Dados Estruturados e Não-Estruturados
O principal objetivo desta pesquisa consiste em desenvolver uma abordagem capaz de analisar os informações expressas em redes sociais baseadas em localização (LBSNs) no contexto de recomendação de recursos urbanos com o uso da KDT de modo a relacionar aspectos referentes a polaridade das informações e a confiabilidade dos perfis que as difundiram. Para tanto, foram utilizadas abordagens de Web Mining no processo de descoberta de conhecimentos e análise de dados. As features extraídas foram então aplicadas à algoritmos tradicionais de recomendação, baseados em vizinhança e em fatoração de matrizes, de modo a apurar métricas de acurácia com seu uso.
Para a correta execução do código, devem ser instalas as bibliotecas auxiliares utilizadas no desenvolvimento. A instalação destas pode ser feita através do seguinte comando:
$ pip3 install -r requirements.txt
Execução da aplicação via terminal:
$ python3 main.py
Arquivo | Descrição |
---|---|
main | arquivo principal onde realizam-se as chamadas aos demais métodos que compõe o pipeline de execução |
webscraping | script desenvolvido de modo ad-hoc para coleta de dados provenientes da fonte utilizada (Foursquare) |
preprocess | script de pré-processamento dos dados |
process | script de processamento dos dados a serem analisados |
analyser | script desenvolvido para análise de dados do dataset de modo a extrair indicadores a serem utilizados no processo de recomendação |
recommendation | script onde são aplicados os algoritmos de recomendação utilizando a biblioteca surprise |
ontology | script de população automazida da ontologia a partir do conjunto de dados atual |
Extraction and Application of Indicators in the Urban Resource Recommendation Process Using Structured and Non-Structured Data
Source code developed for implementation of the practical part referring to the dissertation presented as a partial requirement to obtain a Master's degree in Computer Science.
The main objective of this research is to develop an approach capable of analyzing information expressed in social networks based on location (LBSNs) in the context of the recommendation of urban resources with the use of KDT in order to relate the aspects related to the polarity of the information to the reliability of the profiles that disseminated them. In order to do so, we used "Web Mining" approaches in the process of knowledge discovery and data analysis. The features extracted were then applied to the traditional algorithms of recommendation, based on neighborhood and factoring matrices, in order to ascertain accuracy metrics with its use.
For the correct execution of the code, the auxiliary libraries used in the development must be installed. The installation of these can be done through the following command:
$ pip3 install -r requirements.txt
Execution of the application via the terminal:
$ python3 main.py
File | Description |
---|---|
main | the main file where the invocationcalls to the other methods that compose the execution pipeline are made |
webscraping | script developed ad-hoc mode for collecting data from the used data source (Foursquare) |
preprocess | preprocessing data script |
process | script for processing the data to be analyzed |
analyser | script developed for data analysis of dataset in order to extract indicators to be used in the recommendation process |
recommendation | script where the recommendation algorithms are applied using the surprise library |
ontology | script for automated population of the ontology from the current data set |