Skip to content

mattgoncalves/PE2LGP

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PE2LGP: traduzindo português para língua gestual portuguesa

PE2LGP é um sistema de tradução de texto em português europeu para língua gestual portuguesa.

Descrição

O sistema de tradução divide-se em dois módulos. O primeiro módulo, construção de regras de tradução, consiste na extração de informações linguísticas do corpus de referência da língua gestual portuguesa e, a partir dessas informações, na criação de regras automáticas. O segundo módulo, tradução automática, consiste na tradução de texto em português europeu para língua gestual portuguesa (LGP), em que a frase em LGP é representada por uma sequência de glosas com marcadores que identificam as expressões faciais e palavras soletradas. Na base da tradução encontram-se as regras automáticas e regras manuais.

Disponibilizamos ainda o script para a avaliação automática do sistema de tradução, usando as medidas TER e BLEU.

Requisitos

Para correr o PE2LGP:

  1. Instalar Python 3

  2. Instalar as bibliotecas do Python necessárias:

pip install -r requirements.txt
  1. Instalar a biblioteca Freeling 4.1

  2. Download do modelo pré-treinado do SpaCy para a análise de dependências:

python -m spacy download pt_core_news_sm

Para correr o script de avaliação automática:

  1. Instalar Python 2

  2. Instalar a biblioteca pyter:

pip2 install pyter

Utilização (Ubuntu)

Módulo de construção de regras automáticas

cd Modulo_construcao_regras
python criacao_regras_automaticas.py ficheiro.html

ficheiro.html é o ficheiro html exportado do ELAN. Um exemplo deste ficheiro encontra-se em /modulo_construcao_regras/Corpus/exemplo.html

Módulo de tradução automática

cd Modulo_tradutor
python tradutor.py

Avaliação automática

cd Avaliacao
python aval_automatica.py corpus_teste.csv traducoes.csv

corpus_teste.csv é o ficheiro com o corpus de teste. O corpus de teste usado na avaliação do sistema encontra-se em /Avaliacao/corpus_teste.csv.

traducoes.csv é o ficheiro com as traduções das frases em português no corpus de teste do sistema de tradução automática. Este ficheiro encontra-se em /Avaliacao/traducoes.csv.

Contactos

Desenvolvido por Matilde Gonçalves, matilde.do.carmo.lages.goncalves@tecnico.ulisboa.pt