Skip to content

🐍 Pacote Python contendo os corpora do projeto DANTE do POeTiSA πŸ“

License

Notifications You must be signed in to change notification settings

DANTE-POeTiSA/dante-corpora

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

22 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

Contributors Forks Stargazers Issues MIT License


Logo

DANTE Corpora

Pacote Python contendo os corpora do projeto DANTE do POeTiSA

Report Bug - Request Feature


Instalacao

pip install dante-corpora

(back to top)

Conjunto de Dados

Esta biblioteca contempla os seguintes corpora:

  1. DANTEStocks: Corpus de tweets que usam termos do mercado financeiro. Esse corpus foi segmentado em 3 Pandas DataFrame:

    • base: Conteudo dos tweets;
    • emotion: Camada de anotacao dos tweets;
    • pos: Camada de anotacao Morfossintatica (Part of Speech).
  2. DANTEShots: Corpus de tweets de pessoas politicas sobre a vacinacao contra a COVID-19. Esse corpus foi segmentado em 3 Pandas DataFrame:

    • base: Conteudo dos tweets;
    • stance: Camada de anotacao de posicionamento;
    • pos: Camada de anotacao Morfossintatica (Part of Speech).

(back to top)

Exemplos de uso

# Importacao da biblioteca
from dante.corpora import Dante

# Instanciando qual corpus sera usado
stocks = Dante('dantestocks')

# Instanciando conjuntos de dados 
base = stocks.get_data('base')
emotion = stocks.get_data('emotion')
pos = stocks.get_data('pos')

# Exibindo as 5 primeiras linhas do conjunto base
print(base.head())

(back to top)

Contribuicao

Contribuicoes sao bem-vindas! Sinta-se a vontade para propor melhorias, relatar problemas ou abrir pull requests.

(back to top)

Licenca

Este projeto e licenciado sob a Licenca MIT.

(back to top)

About

🐍 Pacote Python contendo os corpora do projeto DANTE do POeTiSA πŸ“

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages