Este repositório contém o código fonte para abordagem de detecção e anotação de linguagem tóxica em textos em Português.
- Python 3 (or later)
pip install -r requirements.txt
- (http://nilc.icmc.usp.br/nilc/index.php/repositorio-de-word-embeddings-do-nilc) para download das embeddings pré-treinadas
python main.py
@inproceedings{brasnam,
author = {Francisco R. Neto and Rafael Anchiêta and Raimundo Moura and André Santana},
title = { Abordagem Semi-Supervisionada para Anotação de Linguagem Tóxica},
booktitle = {Anais do XIII Brazilian Workshop on Social Network Analysis and Mining},
location = {Brasília/DF},
year = {2024},
keywords = {},
issn = {2595-6094},
pages = {116--129},
publisher = {SBC},
address = {Porto Alegre, RS, Brasil},
doi = {10.5753/brasnam.2024.2965},
url = {https://sol.sbc.org.br/index.php/brasnam/article/view/29337}
}