PE2LGP é um sistema de tradução de texto em português europeu para língua gestual portuguesa.
O sistema de tradução divide-se em dois módulos. O primeiro módulo, construção de regras de tradução, consiste na extração de informações linguísticas do corpus de referência da língua gestual portuguesa e, a partir dessas informações, na criação de regras automáticas. O segundo módulo, tradução automática, consiste na tradução de texto em português europeu para língua gestual portuguesa (LGP), em que a frase em LGP é representada por uma sequência de glosas com marcadores que identificam as expressões faciais e palavras soletradas. Na base da tradução encontram-se as regras automáticas e regras manuais.
Disponibilizamos ainda o script para a avaliação automática do sistema de tradução, usando as medidas TER e BLEU.
Para correr o PE2LGP:
-
Instalar Python 3
-
Instalar as bibliotecas do Python necessárias:
pip install -r requirements.txt
-
Instalar a biblioteca Freeling 4.1
-
Download do modelo pré-treinado do SpaCy para a análise de dependências:
python -m spacy download pt_core_news_sm
Para correr o script de avaliação automática:
-
Instalar Python 2
-
Instalar a biblioteca pyter:
pip2 install pyter
Módulo de construção de regras automáticas
cd Modulo_construcao_regras
python criacao_regras_automaticas.py ficheiro.html
ficheiro.html
é o ficheiro html exportado do ELAN. Um exemplo deste ficheiro encontra-se em /modulo_construcao_regras/Corpus/exemplo.html
Módulo de tradução automática
cd Modulo_tradutor
python tradutor.py
Avaliação automática
cd Avaliacao
python aval_automatica.py corpus_teste.csv traducoes.csv
corpus_teste.csv
é o ficheiro com o corpus de teste. O corpus de teste usado na avaliação do sistema encontra-se em /Avaliacao/corpus_teste.csv
.
traducoes.csv
é o ficheiro com as traduções das frases em português no corpus de teste do sistema de tradução automática. Este ficheiro encontra-se em /Avaliacao/traducoes.csv
.
Desenvolvido por Matilde Gonçalves, matilde.do.carmo.lages.goncalves@tecnico.ulisboa.pt