Los problemas de procesar el lenguaje natural y de extraer información, han sido atacados desde hace varÃas décadas y el presente documento hace una revisión de estos intentos. Sin embargo, las investigaciones no han sido suficientes para diseñar un sistema que rinda como un humano al interpretar lenguaje natural. El lenguaje natural escapa a todos los esfuerzos de tratamiento computacional, al parecer, debido a que el conocimiento lingüÃstico está asociado, de formas sutiles y desconocidas, con el conocimiento contextual que tiene el hablante. El presente trabajo es la investigación previa del estado del arte de esta área de conocimiento, para abordar posteriormente el problema especÃfico del procesamiento del lenguaje natural en forma escrito y la extracción de información a partir colecciones de textos. Este proyecto pretenderá desarrollar una herramienta para interpretar documentos en español y extraer de ellos buenos descriptores.
Tabla de Contenido
1.- Introducción: ¿Qué pretende el proyecto?
2.- Marco Teórico: ¿En qué se basa?
2.1. Recuperación de Información.
2.1.1. MinerÃa de Texto.2.2. Procesamiento del Lenguaje Natural.
2.1.2. Extracción de Información.
2.2.1. LingüÃstica Computacional.2.3. Modelos del NLP.
2.2.2. El Lenguaje desde el punto de vista cientÃfico.
2.2.3. Problemas en el uso del Lenguaje Natural.
2.3.1. Modelo Simbólico.
2.3.1.1. Fundamentos teóricos: gramáticas formales.
2.3.1.2. Estructura de un sistema PLN simbólico.
- Gramáticas regulares o de estados finitos.
- Gramáticas Independientes del Contexto.
- Gramáticas de Unificación y Rasgos.
2.3.1.3. Ejemplo de modelos simbólicos: una gramática para el español.
2.3.2. Modelo EstadÃstico.
2.3.2.1. Modelos estadÃsticos en CL.2.3.3. Modelo Biológico.
2.3.2.2. Ejemplo de modelos estadÃsticos: una gramática probabilÃstica para el español.
- Técnicas básicas, estimación y evaluación de probabilidades.
- Modelo de N-gramas.
2.3.3.1. Redes neuronales.
2.3.3.2. La computación evolutiva: Algoritmos genéticos.
2.3.3.3. Ejemplo de modelos biológicos: tratamiento de fonemas en español.
2.3.4. Comparación de los modelos de NLP.2.4. Revisión Histórica del NLP.
3.- Definición del Problema.
4.- MetodologÃa: ¿Cómo? ¿Cuál es la Estrategia?
5.- Conclusiones.