install.packages("remotes")
remotes::install_github("DANTE-POeTiSA/dante.corpora")
Esta biblioteca contempla os seguintes corpora:
-
DANTEStocks: Corpus de tweets que usam termos do mercado financeiro. Esse corpus foi segmentado em 3 R data.frame:
- base: Conteudo dos tweets;
- emotion: Camada de anotacao dos tweets;
- pos: Camada de anotacao Morfossintatica (Part of Speech).
-
DANTEShots: Corpus de tweets de pessoas politicas sobre a vacinacao contra a COVID-19. Esse corpus foi segmentado em 3 R data.frame:
- base: Conteudo dos tweets;
- stance: Camada de anotacao de posicionamento;
- pos: Camada de anotacao Morfossintatica (Part of Speech).
df_pos_stocks <- dante.corpora::get_corpus("dantestocks", "pos")
print(df_pos_stocks)
Contribuicoes sao bem-vindas! Sinta-se a vontade para propor melhorias, relatar problemas ou abrir pull requests.
Este projeto e licenciado sob a Licenca MIT.