Saltar apartados
Universidad de Alicante

Proyecto

Reconocedor de entidades multilingüe (español, valenciano, inglés)

Referencia: GV04B/268
Financiación: Consellería de Cultura, Educación y Deporte
Periodo: desde 01/01/2004 hasta 31/12/2005
Director: Muñoz Guillena, Rafael
Miembros: Ferrández Rodríguez, Antonio
Llopis Pascual, Fernando
Muñoz Terol, Rafael
Peral Cortés, Jesús
Saquete Boró, Estela
Toral Ruiz, Antonio
Resumen del projecto:
El objetivo principal de este proyecto es construir un reconocedor de entidades con nombres para el español, inglés y valenciano. Este reconocedor tratará de forma automática un texto escrito en español, valenciano o inglés identificando, clasificando y desambigüando las entidades que en él aparecen. Se entiende por entidades con nombres aquellas porciones de textos que hacen referencias a personas, empresas, lugares o expresiones temporales o numéricas.
Áreas como la Recuperación de Información (RI), extracción de Información (EI) y Búsqueda de Respuestas (BR), en particular, y en general aplicaciones de Procesamiento de Lenguaje Natural, necesitan de un módulo que les proporcione información acerca de las entidades con nombres para mejorar la eficiencia de sus sistemas. Este proyecto pretende llenar un vacío que existe en la comunidad científica española para permitir aumentar la eficiencia de los sistemas anteriormente citados.
El objetivo principal científico y tecnológico del proyecto se centra en el campo de investigación denominado reconocimiento de entidades (conocido en inglés, Named Entity Task (NE)). En términos generales, el reconocimiento de entidades consiste en asociar una categoría (persona, organización, lugar, expresión temporal, expresión numérica) a una palabra dada o un conjunto de palabras de un texto, lo que permite distinguirla de otros posibles categorías de esa palabra. Entrando más en detalle, el reconocedor de entidades consistiría en preprocesar un texto no restringido en cualquier lengua con el fin de extraer un conjunto de características (pistas o indicios), para posteriormente usarlas para asignar a cada palabra o conjunto de palabras del texto la categoría más probable, adecuada y eficiente. En un reconocedor de entidades se distinguen las siguientes etapas: identificación de la entidad, clasificación de la entidad y desambiguación de la entidad.

Departamento de Lenguajes y Sistemas Informáticos


Universidad de Alicante, carretera San Vicente s/n

03690 San Vicente del Raspeig, Alicante (Spain)

Tel: (+34) 96 590 3772 | Fax: (+34) 96 590 9326

Síguenos en:
[Twitter] [Facebook]