Skip to content
rvignacio edited this page Jul 6, 2011 · 7 revisions

#Documentación general del proyecto

##Alumnos:

  • Martín Ciparelli
  • Ignacio Ríos Vazquez

##Tutor:

  • Ricardo Wehbe

###Objetivos Desarrollar una herramienta de análisis de textos que sirva como base y primera etapa de la construcción de un LEL semi-automático.

###Alcance El proyecto incluye los siguientes aspectos:

  • Se desarrollará un prototipo de extracción de información a partir de documentos de texto no estructurados.
  • Se analizarán únicamente textos técnicos (no necesariamente requerimientos, pero sí quedan fuera del alcance cualquier texto literario) vinculados con la creación del LEL.
  • De estos textos se extraerán candidatos a sujetos y objetos (la distinción semántica de estos queda fuera del alcance), verbos y estados.
  • Se etiquetarán las palabras del texto analizado de acuerdo con su función gramatical para la eventual construcción de un árbol sintáctico.
  • No se realizará ningún tipo de análisis semántico de los textos.
  • No se pretende construir el árbol sintáctico, aunque se analizarán las condiciones necesarias y se sentarán las bases para hacerlo.

###Descripción de la propuesta El trabajo se involucra en el proyecto de requerimientos. Se buscará construir un analizador de textos que separe candidatos a sujeto/objeto, verbos y estados de un texto técnico en lenguaje natural en español (ver 1.2.Alcance para una enumeración de los tipos de textos que se analizarán). El prototipo producirá una salida en la que todas las palabras del texto estarán etiquetadas con sus funciones gramaticales (sustantivos, adjetivos, artículos, adverbios y verbos). Dicho análisis sintáctico podrá utilizarse para una eventual construcción de un árbol sintáctico. Se analizarán los problemas por ser resueltos para la construcción del referido árbol.
El trabajo pretende ser un punto de partida para investigaciones futuras que apunten a la construcción de una herramienta semi-automática de extracción de LEL.

###Aportes Sentar las bases para futuros desarrollos de "text-mining" aplicados a los documentos de requerimientos.

###Verficación Se realizará una comparativa visual entre los resultados del analizador y un análisis humano realizado por los autores.

Índice

####Contexto teórico

####Milestone 1

Clone this wiki locally