Curso de doctorado 60443 (3 créditos):

APLICACIONES DE LA INFORMÁTICA

Código de programa:  5099 
Dpto. coordinador:  Lenguajes y Sistemas Informáticos

"Introducción al Procesamiento del Lenguaje Natural"

 
 

Profesores

 

Manuel Palomar Sanz

Antonio Ferrández Rodríguez

 

 

Breve descripción

El Procesamiento del Lenguaje Natural (PLN) es una parte esencial de la Inteligencia Artificial  que investiga y formula mecanismos computacionalmente efectivos que faciliten la interrelación hombre/máquina y permitan una comunicación mucho más fluida y menos rígida que los lenguajes formales. Todo sistema de PLN intenta simular un comportamiento lingüístico humano; para ello debe tomar conciencia tanto de las estructuras propias del lenguaje, como del conocimiento general acerca del universo de discurso. De esta forma, una persona que participa en un diálogo  sabe cómo combinar las palabras para formar una oración, conoce los significados de las mismas, sabe cómo éstos afectan al significado global de la oración y posee un conocimiento del mundo en general que le permite participar en la conversación. En este curso se realiza una breve introducción al PLN presentando la organización de los sistemas de comprensión del lenguaje natural (módulos de análisis léxico, sintáctico y semántico) y las aplicaciones del PLN que coexisten actualmente en este campo (traducción automática, acceso a Bases de Datos, extracción de información en Bases de Datos, recuperación o búsqueda de información, etc.).


Objetivos

 

Programa

  1. Conceptos y problemas básicos que se derivan del procesamiento del lenguaje natural , así como sus aplicaciones, orígenes y tendencias actuales. Aunque estos conceptos se desarrollarán a lo largo del texto, se trata de dar una idea global sobre los aspectos más relevantes y las diferentes fases de análisis que irán adquiriendo mayor significado a medida que se avance en el estudio de la materia. 

  2. Introducción al análisis léxico; en él, después de presentar conceptos generales sobre información léxica y su representación, se estudian algunos aspectos de la influencia de las restricciones semánticas en las entradas léxicas.

  3. Fundamentos del análisis sintáctico , modelos de representación de las estructuras sintácticas y algoritmos de análisis. Técnicas de análisis parcial y global.

  4. Análisis semántico. Concepto de Forma Lógica . Características deseables en un lenguaje de especificación de la Forma Lógica con el fin de capturar e interpretar la semántica de una palabra, oración o texto.

  5. Proceso de transformación de la Forma Lógica  en la representación del significado  final. Asociado a este proceso, denominado Interpretación Contextual, se estudia el problema de resolver las referencias y elisiones que se producen en los lenguajes naturales teniendo en cuenta el contexto. 

El curso tendrá una base teórica que se pondrá en práctica sobre diferentes sistemas de Procesamiento del Lenguaje Natural.

 

Enlaces de interés

Herramientas a utilizar a lo largo del curso:

Analizadores morfológicos

ARIES Natural Language Tools
Multext tools
PC-KIMMO tagger/análisis morfológico
Universidad de Las Palmas de Gran Canaria
Maco analizador morfológico español y análisis sintáctico (UPC)

Diccionarios

Dictionaries: A Web of On-line
Dictionary List

Etiquetadores (Part-of-Speech o POS taggers)

Brill's English POS Tagger
MBT POS Tagger Demo: Dutch English Spanish Swedish Slovene
POS tagger español SpaCG-2 (by Conexor)
POS tagger Conexor's English
STEMMER de Porter
STEMMER de Porter: CODE in C

Análisis semántico

MIKROKOSMOS
Euro WordNet Descripción proyecto
EuroWordnet Interface 0.1 (by LSI-UPC)
WordNet

Análisis sintáctico

Base de Datos Sintácticos del Español Actual
Clause Splitting Concurso
LFG: Grammar Writer's Workbench for Lexical Functional Grammar
Link Grammar
Memory-Based Shallow Parser Demo
PATRII grammars

Acceso a Bases de Datos en lenguaje natural

Microsoft BackOffice - Expedia Hotel English Query Demo

Corpus

Download the ICE-GB Sample Corpus (inglés)
Recursos de Corpus en Español

Cursos de Procesamiento del Lenguaje Natural y de Prolog

Natural Language Processing (Alison Cawsey)
Prolog course (Basics) by Alison Cawsey
Prolog: A Short Tutorial
Prolog Programming A First Course: EXTENSO

Glosario Lingüístico

Ciber-Lexico Comparativo
Computer, Telephony and Electronics Glossary and Dictionary
Babylon.com Information @ a click
Glosario lingüístico electrónico
Glosario inglés
Glosario de Internet (ATI)
Vocabulario ordenadores e Internet

Gramáticas y analizadores o parsers

HPSG Literature
Link Grammar
Link Grammar Demo
Natural Language Computing: An English Grammar in Prolog
TACAT (Jordi Atserias Batalla's) (TAgged Corpus Analizer Tool)

Extracción de Información

Highlight Information Extraction Demo

Traducción automática

Alis (anglés, francés, alemany, espanyol, italià, rus, japonés, xinés tradicional, xinés simplificat)
AltaVista Translations (babelfish)
Amikai (anglés, francés, espanyol, alemany, japonés, xinñes, portugués, italià coreà)
Automatictrans (castellà, català, portugués)
Babylon Translator Dictionary Converter and Information at your fingertips!
Dictionary.com/Translate
elingo (anglés, espanyol,http://www.alis.com/translate_online.html alemany, italià, portugués, francés, japonés,
FreeTranslation.com - Free Translation from English to Spanish, French, German, Portuguese, Italian, and Norwegian
IBM (anglés, francés, italià, japonés, espanyol, xinés simplificat, xinés tradicional)
interNOSTRUM (Míkel)
INTER TRAN EMPRESA - Translation Experts (natural language translation software)
InterTran (tm) - translate between 729 language pairs!
Introducción MT
L&H Lernout & Hauspie (anglés, francés, alemany, espanyol, italià, portugués)
MINDS: English, Japanese, Russian, Spanish Summarizer-Translator
Polish-English-Polish Translator and online Polish Dictionary.
Reverso translate (anglés, alemany, francés, espanyol, rus)
SAIL LABS - Innovation in Understanding (castellà, català):
Sancho -- Automatic translation of Spanish web pages into English
Spanish to English Translation (Curso IR de la UNED)
Survey of Machine Translation products and services
Transcend Main
WebTranSmart Machine Translation Service (finés, anglés)
WinBabel.Com

 Prototipos de Sistemas de Recuperación de Información

ExtrAns
ITEM Recuperación de Información Textual en un Entorno Multilíngüe con Técnicas de Lenguaje Natural
ITEM Search Engine (Demo)
MULINEX: Demonstrator: multilingual search engine
Natural Language Information Retrieval: electric knowledge
Xerox SPARKLE Cross Language information Retrieval

Updated in June 2001