Código de programa: 5099
Dpto. coordinador: Lenguajes y Sistemas Informáticos
Dptos. Responsables: Lenguajes y Sistemas Informáticos
Director del programa: Jesús Peral Cortés
Nº mínimo de alumnos: 10
Nº máximo de alumnos: --
Áreas de conocimiento: Lenguajes y Sistemas Informáticos
Tribunal de
suficiencia investigadora:
| Presidente: José María Oncina
Carratalá |
Suplente: Augusto Beléndez Vázquez |
| Vocal 1: Manuel Palomar Sanz |
Suplente: Mikel L. Forcada
Zubizarreta |
| Vocal 2: Fernando Torres
Medina |
Suplente: Antonio Ferrández Rodríguez |
Criterios de
admisión:
A) Expediente
académico: 25%
B) Calificación
en asignaturas de licenciatura correspondientes al área o perfil
del programa: 50%
C) Trabajos y
seminarios realizados en relación al área o perfil del programa:
25%
D) Universidad
de la licenciatura: 0%
Presentación de
solicitudes de admisión e información de
horarios:
Dpto. Lenguajes y
Sistemas Informáticos
Tfno:
965903772
E-mail: dlsi ua.es |
PERIODO DE DOCENCIA
| Cód |
Nombre del curso |
Créd |
Tipo |
Fundamentales
|
| 62571 |
TECNOLOGÍAS DEL LENGUAJE HUMANO
Prof. Manuel Palomar Sanz
Prof. Antonio Ferrández Rodríguez
Prof. Lidia Moreno Boronat
Descripción:
El Procesamiento del
Lenguaje Natural (PLN) es una parte esencial de la Inteligencia
Artificial que investiga y formula mecanismos computacionalmente efectivos que
faciliten la interrelación hombre/máquina y permitan una
comunicación mucho más fluida y menos rígida que los lenguajes
formales. Todo sistema de PLN intenta simular un comportamiento
lingüístico humano; para ello debe tomar conciencia tanto de las
estructuras propias del lenguaje, como del conocimiento general
acerca del universo de discurso. De esta forma, una persona que
participa en un diálogo
sabe cómo combinar las palabras para formar una oración, conoce los
significados de las mismas, sabe cómo éstos afectan al significado
global de la oración y posee un conocimiento del mundo en general
que le permite participar en la conversación. En este curso se
realiza una breve introducción al PLN presentando la organización
de los sistemas de comprensión del lenguaje natural (módulos de
análisis léxico, sintáctico y semántico) y las aplicaciones del PLN
que coexisten actualmente en este campo (traducción automática,
acceso a Bases de Datos, extracción de información en Bases de
Datos, recuperación o búsqueda de información,
etc.).
Más información
|
4 |
OP |
| 61726 |
TRADUCCIÓ AUTOMÁTICA: FONAMENTS I APLICACIONS
Prof. Mikel L. Forcada Zubizarreta
Prof. Juan Antonio Pérez Ortiz
Descripción:
Los sistemas de traducción
automática son cada vez más necesarios en las sociedades actuales,
marcadas por su carácter multilingüe; están cada vez más
disponibles por causa de los avances en tecnología informática; y
se usan cada vez más dada la gran disponibilidad de textos
informatizados, principalmente en internet. Pese a ello, los
sistemas existentes distan mucho de ser perfectos. Este curso
estudia las tecnologías fundamentales sobre las que se construyen
los sistemas de traducción automática, en qué situaciones
comunicativas son de utilidad estos sistemas a pesar de su
imperfección, las razones lingüísticas y tecnológicas de las
limitaciones observadas y los criterios que se pueden usar para
evaluar la adopción de un sistema u otro para una aplicación
concreta. Además, se estudian otras tecnologías surgidas
simultáneamente a la traducción automática como las populares
memorias de traducción.
Descripció:
Els sistemes de traducció automàtica són cada vegada més
necessaris en les societats actuals,
marcades pel seu caràcter multilingüe; estan
cada vegada més disponibles a
causa dels avanços en tecnologia informàtica; i s'usen cada vegada més donada la gran
disponibilitat de textos informatitzats, principalment en internet. Malgrat
això, els sistemes existents disten
molt de ser perfectes. Aquest
curs estudia les
tecnologies fonamentals sobre les
quals es construeixen els sistemes de
traducció automàtica, en quines
situacions comunicatives són
d'utilitat aquests sistemes a
pesar de la seva imperfecció,
les raons
lingüístiques i tecnològiques de
les limitacions observades i
els criteris que
es poden usar per a avaluar
l'adopció d'un sistema o un altre per a
una aplicació concreta. A més, s'estudien altres tecnologies sorgides simultàniamente a
la traducció automàtica com les populars
memòries de traducció.
|
4 |
OP |
| 62572 |
EXTRACCIÓN DE INFORMACIÓN TEXTUAL
Prof. Manuel Palomar Sanz
Prof. Rafael Muñoz Guillena
Prof. Patricio Manuel Martínez Barco
Prof. Horacio Rodríguez Hontoria
Descripción:
Introducción a la extracción
de información. Sistemas de extracción de información: LASIE, EXIT.
Tareas de los sistemas de extracción de información: reconocimiento
de entidades, resolución de la correferencia, obtención de
información relevante, inserción de la información en una base de
datos.
|
4 |
OP |
| 62094 |
APRENDIZAJE CON DATOS ESTRUCTURADOS
Prof. Jorge Calera Rubio
Prof. José Oncina Carratalá
Prof. Colin de la Higuera
Descripción:
El principal punto de
interés cuando se utilizan como entrada de un sistema de
aprendizaje automático datos estructurados, es la construcción
automática de modelos (gramáticas, autómatas o, en general sistemas
formales) que expliquen fenómenos representados por dichos datos.
El estudio de las técnicas que permiten realizar esta tarea se
denomina Inferencia Gramatical.
Algunos campos de aplicación de estas técnicas son los
siguientes:
- Correctores sintácticos
- Compresión de datos
- Traducción automática
- Bioinformática
- Minería de datos
Programa:
1. Introducción: Aprendizaje Inductivo e Inferencia Gramatical
2. Identificación en el límite y complejidad
3. Aprendizaje con muestras positivas
4. Aprendizaje con muestras completas
5. Autómatas finitos estocásticos
6. Aprendizaje con muestras jerarquizadas (árboles)
7. Inferencia de lenguajes independientes del contexto
|
4 |
OP |
| 61338 |
BÚSQUEDAS INTELIGENTES DE INFORMACIÓN EN LA WEB
Prof. Antonio Ferrández Rodríguez
Prof. Jesús Peral Cortés
Prof. Fernando Llopis Pascual
Prof. Luis Alfonso Ureña López
Descripción:
La
popularización del uso de Internet ha posibilitado la existencia de
enormes cantidades de información y la ha puesto al alcance de
cualquier usuario de este medio. Sin embargo, la localización de
toda la información realmente relevante acerca de un tema concreto
sigue siendo una labor lenta y tediosa. La aparición de los
buscadores (sistemas que intentan localizar los documentos que en
un momento dado son de nuestro interés) ha facilitado dicha tarea;
sin embargo, los resultados hasta la fecha no son lo
suficientemente satisfactorios y sólo facilitan en pocos aspectos
la búsqueda de la información. Es por ello que se pretende
construir un sistema de recuperación de información (SRI) de sedes
Web. Como recuperación de información (RI) se entiende la capacidad
de seleccionar de entre una gran cantidad de documentos aquellos
cuyo contenido hace referencia a un tema indicado.
Más información
|
4 |
OP |
| 62302 |
ESTUDIO Y APLICACIÓN DE TÉCNICAS DE RECONOCIMIENTO DE FORMAS
Prof. María Luisa Micó Andrés
Prof. José María Oncina Carratalá
Prof. Pierre Dupont
Descripción:
La
facilidad con la que reconocemos un rostro, entendemos palabras
pronunciadas, leemos caracteres manuscritos, identificamos las
llaves del coche en nuestro bolsillo simplemente por el tacto, o
decidir cuándo una manzana está madura por su olor, oculta el
complejo proceso que está detrás de este reconocimiento de formas.
El reconocimiento de formas es una disciplina fuertemente vinculada
a la informática, estudia cómo construir sistemas automáticos
capaces de emular aspectos perceptivos propios del comportamiento
humano.
¿Cómo se construyen estos sistemas? Básicamente constan de tres fases:
preproceso (segmentación de la señal, eliminación de ruido, realzado de
características importantes, ...), extracción de características (nos
quedamos solamente con las propiedades más relevantes, reduciendo de
esta manera los datos) y por último la clasificación.
En este curso de doctorado revisaremos cada uno de estos aspectos
haciendo especial hincapié en la tercera fase, aquellos aspectos
relacionados con la clasificación.
|
4 |
OP |
| 62569 |
ENTORNOS AVANZADOS DE PRODUCCIÓN DE SOFTWARE PARA AMBIENTES WEB
Prof. Jaime Gómez Ortega
Prof. Antonio Vallecillo Moreno
Objetivos de las asignatura / competencias
Este curso presenta una visión general de la problemática asociada al diseño de sistemas web y de las diversas herramientas, abstractas o no, que se han desarrollado para facilitar el proceso de desarrollo de este tipo de sistemas técnicas de generación de código basadas en modelos.
Los objetivos son:
- Comprender y analizar los problemas de diseño que pueden plantearse en el desarrollo de sistemas web.
- Analizar los requisitos del sistema, teniendo en cuenta las necesidades de los usuarios.
- Diseñar e implementar aplicaciones web en entornos de autoría en colaboración.
- Evaluar y aplicar métodos basados en MDD/MDA para el desarrollo de este tipo de sistemas.
Contenidos teóricos y prácticos
- Módulo I: Entornos Avanzados de Producción de software Orientados a Objetos
- introducción
- estrategias de generación OO
- ejecución de modelos
- algunos sistemas de producción de software
- equivalencia funcional
- conclusiones
- Módulo II: Diseño Conceptual de Aplicaciones Web
- características de las aplicaciones web
- el método OO-H
- la herramienta visualWADE
- conclusiones
- Módulo III: Modelado de Aplicaciones Web con MDA
- introducción. modelos y metamodelos
- estándares OMG para modelado
- MDA primer
- usando MDA
- próximos avances en MDA
- conclusiones
|
4 |
OP |
| 62303 |
COMPUTACIÓN AVANZADA PARA MÚSICA POR ORDENADOR
Prof. José Manuel Iñesta Quereda
Prof. Xavier Serra Casals
Prof. Ramón López de Mántaras
Descripción:
Los
métodos de reconocimiento de formas, aprendizaje computacional,
etc. han invadido en los últimos tiempos el terreno de la
informática musical. Tres grandes áreas dentro de este campo son
sus objetivos:
- El desarrollo de programas
relacionados con la composición automática o asistencia a la
misma,
- La modelización de procesos
cognitivos asociados con la escucha de la música: deteccion de
notas, análisis melódicos y armónicos, etc., y
- La simulación de la
interpretación de partituras: expresión, armonización,
acompañamiento, etc.
Para esto técnicas neurales,
genéticas, fractales, gramaticales, etc. han sido puestas en juego
para hacer progresar esta área interdisciplinar.
Más información
|
4 |
OP |
| 62566 |
CALIDAD EN EL DISEÑO DE APLICACIONES WEB
Prof. Cristina Cachero Castro
Prof. Marcela Genero Bocco
Descripción:
Con el avance
de Internet como entorno preferido por muchas organizaciones para
el desarrollo de aplicaciones cada vez más complejas en términos de
contenido, estructura, comportamiento e interfaz, se ha hecho
patente la necesidad de técnicas que no sólo ayuden en su
construcción sino que garanticen que el producto resultante
(aplicación Web) se adhiere a determinados criterios de calidad. El
estudio y aplicación de dichos criterios (intuitividad de la
estructura navegacional, rendimiento, accesibilidad, etc.) es un
campo emergente dentro de la Ingeniería del Software. En este
curso, tras revisar las técnicas de modelado hipermedial existentes
en la actualidad, se presentarán los principales modelos y
estándares de calidad existentes. A continuación presentaremos las
modificaciones que son necesarias para adaptar estos modelos a la
idiosincrasia de las aplicaciones Web. Por último, presentaremos un
conjunto de técnicas de evaluación experimiental que permiten
demostrar la validez de las métricas de calidad
propuestas.
|
4 |
OP |
| 62565 |
XML, MARCADO DE TEXTOS Y BIBLIOTECAS DIGITALES
Prof. Rafael C. Carrasco Jiménez
Descripción:
El
desarrollo actual de las bibliotecas digitales (y de Internet)
permite consultar grandes volúmenes de información. Una forma de
que esta información resulte más útil es su marcado, idea que ha
originado la definición de técnicas y lenguajes de marcado (como el
popular HTML o los estándares SGML y XML) y constituye, hoy en día,
uno de los campos de desarrollo más activos. En este curso veremos
cómo se utilizan y definen lenguajes de marcado así como nuevas
técnicas de búsqueda, de transformación y recuperación de la
información.
Descripció:
El
desenvolupament actual de les biblioteques digitals (i d'Internet)
permet consultar grans volums d'informació. Una forma que aquesta
informació resulte més útil és el seu marcat, idea que ha originat
la definició de tècniques i llenguatges de marcat (com el popular
HTML o els estàndards SGML i XML) i constitueix, avui en dia, un
dels camps de desenvolupament més actius. En aquest curs veurem com
s'utilitzen i defineixen llenguatges de marcat així com noves
tècniques de recerca, de transformació i de recuperació de la
informació.
Més
informació
|
4 |
OP |
| 62304 |
DISEÑO Y EXPLOTACIÓN DE ALMACENES DE DATOS
Prof. Juan Carlos Trujillo Mondéjar
Prof. Mario Piattini Velthuis
Prof. Stefano Rizzi
Descripción:
A principios de los noventa surgen los almacenes de datos (Data
Warehouses, DW), bases de datos multidimensionales y herramientas
OLAP (On-Line Analitycal Processing) como un conjunto de técnicas,
bases de datos, métodos y herramientas para facilitar al analista
de la información el acceso a una gran cantidad de información
histórica que le facilite la adopción de decisiones
estratégicas.
El objetivo principal de
este curso de doctorado es introducir al alumno en el diseño y
explotación de los almacenes de datos. En una primera parte se
introducirán los aspectos teóricos imprescindibles que se manejan
en estos sistemas. Una vez conseguido esto, se propondrán casos de
estudio para que el alumno se enfrente a problemas reales que
surgen al implantar almacenes de datos. Una vez diseñado el almacén
datos, se pedirá al alumno que se familiarice con el análisis OLAP
a través de algunas de las herramientas OLAP más extendidas del
mercado. Con todo ello, pretendemos que el alumno adquiera una gran
destreza en esta nueva tendencia de bases de datos cuya aceptación
tanto en el marco empresarial como científico en estos últimos años
es incuestionable.
Por otro lado, todavía no se
disponen de modelos o herramientas estándares (como sucede con las
bases de datos relacionales) para afrontar todas las fases de
diseño de un almacén de datos. En este sentido, en estos últimos
años han surgido varias propuestas realizadas por la comunidad
académica. Por ello, una parte del temario de este curso será
presentar estas propuestas, valorarlas y estudiar cómo utilizarlas
conjuntamente con las herramientas comerciales para afrontar un
proyecto real de almacenes de datos.
|
4 |
OP |
| 61728 |
TÈCNIQUES AVANÇADES EN TRADUCCIÓ AUTOMÀTICA
Prof. Mikel L. Forcada Zubizarreta
Prof. Rafael Carlos Carrasco Jiménez
Descripción:
En
este curso se estudiarán en detalle diversas técnicas usadas para
la implementación eficiente de sistemas de traducción automática:
transductores de estados finitos, desambiguadores léxicos
estadísticos y basados en reglas, chunkers, analizadores
sintácticos, alineamiento de textos bilingües y su aprovechamiento
y traducción automática estadística.
Descripció:
En
aquest curs s'estudiaran en detall diverses tècniques usades per a
la implementació eficient de sistemes de traducció automàtica:
transductores d'estats finits, desambiguadors lèxics estadístics i
basats en regles, chunkers, analitzadors sintàctics, alineament de
textos bilingües i el seu aprofitament i traducció automàtica
estadística.
|
4 |
OP |
| 62573 |
USO Y DISEÑO DE ONTOLOGÍAS EN PROCESAMIENTO DEL LENGUAJE NATURAL Y LA WEB SEMÁNTICA
Prof. Maximiliano Saiz Noeda
Prof. Andrés Montoyo Guijarro
Prof. José Luis Vicedo González
Prof. Manuel Palomar Sanz
Prof. German Rigau Claramunt
Prof. Armando Suárez Cueto
Descripción:
PROGRAMA
- Conceptos y
componentes de una ontología aplicados a PLN y web
semántica
- Recursos ontológicos
- Uso de ontologías
- Las ontologías y el Procesamiento del Lenguaje Natural
- Las ontologías en el WSD
- Las ontologías en la Búsqueda de Respuestas
- Las ontologías y la web semántica
- Diseño de ontologías
- Disertaciones bibliográficas
OBJETIVOS
- Estudio de los conceptos fundamentales sobre las
clasificaciones ontológicas y sus componentes
- Estudio y uso de los recursos ontológicos más relevantes
- Aplicación de las ontologías en tareas de Procesamiento del
Lenguaje Natural y la web semántica
- Aprendizaje de diseño de ontologías aplicadas al PLN
|
4 |
OP |
Metodológicos
|
| 61345 |
CÓMO SE ESCRIBEN Y SE PUBLICAN TRABAJOS CIENTÍFICOS
Prof. Mikel L. Forcada Zubizarreta
Prof. Juan Antonio Pérez Ortiz
Descripción:
La difusión adecuada de los trabajos de investigación es
crucial para el desarrollo de la ciencia; pero una de las fases más
difíciles del trabajo de un investigador es la de explicar lo que
ha hecho en un documento que quiere publicar. Este curso da a los
investigadores en formación la oportunidad de conocer y reflexionar
sobre los diferentes aspectos relacionados con la publicación
científica, desde el primer borrador hasta la versión
definitiva: estructura del documento, normas de estilo,
técnicas de composición, gestión de bibliografías, envío a revistas
y congresos, presentaciones orales, diseño de pósters, etc. Los
estudiantes del curso adquirirán la formación necesaria para
afrontar con éxito la publicación de sus trabajos científicos,
incluida la tesis a la que muchos de ellos se dedicarán en años
posteriores.
Descripció:
La difusió
adequada dels treballs d'investigació és crucial per al
desenvolupament de la ciència; però una de les fases més difícils
del treball d'un investigador és la d'explicar el que ha fet en un
document que vol publicar. Aquest curs dóna als investigadors en
formació l'oportunitat de conèixer i reflexionar sobre els
diferents aspectes relacionats amb la publicació científica, des
del primer esborrany fins la versió definitiva: estructura del
document, normes d'estil, tècniques de composició, gestió de
bibliografies, enviament a revistes i congressos, presentacions
orals, disseny de pòsters, etc. Els estudiants del curs adquiriran
la formació necessària per a afrontar amb èxit la publicació dels
seus treballs científics, inclosa la tesi a la qual molts d'ells es
dedicaran en anys posteriors.
|
4 |
OP |
PERIODO DE INVESTIGACIÓN
| Cód | Nombre del curso |
Créd |
Tipo |
| 62570 |
TRABAJO DE MÚSICA POR COMPUTADOR
Prof. José Manuel Iñesta Quereda
Prof. Francisco Moreno Seco
Descripción:
El uso de técnicas de inteligencia artificial está bastante extendido
en la música digital. Se pueden aplicar redes neuronales,
algoritmos genéticos y técnicas de inferencia gramatical para
interpretar, componer o reconocer melodías. Se propone el estudio
de alguna de estas técnicas para resolver algún problema que se
propondrá.
|
12 |
OP |
| 60456 |
TÈCNIQUES D'ESTATS FINITS EN TRADUCCIÓ AUTOMÀTICA
Prof. Mikel L. Forcada Zubizaterra
Prof. Rafael Carlos Carrasco Jiménez
Prof. Juan Antonio Pérez Ortiz
Descripción:
Muchas
de las tareas básicas de un sistema de traducción automática, como
el análisis morfológico, la generación léxica, la desambiguación
léxica, la consulta de diccionarios bilingües o el análisis
sintáctico superficial, se pueden implementar muy eficientemente
(llegando a velocidades del orden de 10.000 palabras por segundo
sobre un PC) usando modelos de estados finitos como los autómatas
finitos deterministas o los transductores p-subsecuenciales.
El trabajo de investigación versará sobre alguna de estas tareas
básicas de la traducción automática, en el marco de un proyecto
activo.
|
12 |
OP |
| 61725 |
TRABAJO SOBRE TÉCNICAS DE RECONOCIMIENTO DE FORMAS
Prof. María Luisa Micó Andrés
Prof. Juan Ramón Rico Juan
Descripción:
Estudio
y desarrollo de técnicas avanzadas de reconocimiento de formas con
aplicación a alguno de los problemas concretos como los mencionados
en la descripción del curso de doctorado "Estudio y aplicación de
técnicas de reconocimiento de formas". Estas técnicas abarcan desde
algoritmos de clasificación utilizando técnicas de vecinos más
próximos, como técnicas de aprendizaje no supervisado que se
utilizan básicamente para obtener grupos naturales a partir de un
conjunto de datos.
|
12 |
OP |
| 60460 |
XARXES NEURALS RECURRENTS I RECURSIVES
Prof. Juan Antonio Pérez Ortiz
Descripción:
Las redes recurrentes de
tiempo discreto y las redes neurales recursivas --y los algoritmos
de entrenamiento específicos desarrollados para ellas-- constituyen
una de las posibles soluciones cuando las tareas comportan el
procesamiento adaptativo de secuencias de datos o de estructuras
más complejas de los mismos como árboles o grafos dirigidos
acíclicos. El trabajo de investigación tutelada versará sobre
alguna aplicación de estas técnicas, y se realizará en el marco de
un proyecto financiado por la CICyT y de diversas colaboraciones
internacionales.
|
12 |
OP |
| 60461 |
CLASIFICACIÓN DE DOC. ELECTRÓNICOS BASADA EN TEC. PROCES. DEL LENGUAJE
NATURAL
Prof. Manuel Palomar Sanz
Prof. José Luis Vicedo González
Descripción:
Cada
vez más, las organizaciones e instituciones requieren más tiempo
para clasificar documentos, informes, mensajes de publicidad, etc.
en sus diferentes departamentos. Por todo ello, se pretende
estudiar y desarrollar un sistema capaz de clasificar documentos
según diferentes temas.
|
12 |
OP |
| 60462 |
OBTENCIÓN DE RESÚMENES DE DOCUMENTOS BASADA EN CADENAS DE REFERENCIA
Prof. Manuel Palomar Sanz
Descripción:
Se
pretende desarrollar técnicas de obtención de resúmenes de textos
que toman como entrada documentos completos. Para ello, nos
basaremos en técnicas de resolución de la correferencia
lingüística, es decir, se pretende obtener las cadenas de
correferencia lingüística existentes en el texto y en base a estas
cadenas construir un método capaz de obtener resúmenes de
textos.
|
12 |
OP |
| 60463 |
RECUPERACIÓN DE INFORMACIÓN DE SEDES WEB
Prof. Antonio Ferrández Rodríguez
Descripción:
La
popularización del uso de Internet ha posibilitado la existencia de
enormes cantidades de información y la ha puesto al alcance de
cualquier usuario de este medio. Sin embargo, la localización de
toda la información realmente relevante acerca de un tema concreto
sigue siendo una labor lenta y tediosa. La aparición de los
buscadores (sistemas que intentan localizar los documentos que en
un momento dado son de nuestro interés) ha facilitado dicha tarea;
sin embargo, los resultados hasta la fecha no son lo
suficientemente satisfactorios y sólo facilitan en pocos aspectos
la búsqueda de la información. Es por ello que se pretende
construir un sistema de recuperación de información (SRI) de sedes
Web. Como recuperación de información (RI) se entiende la capacidad
de seleccionar de entre una gran cantidad de documentos aquellos
cuyo contenido hace referencia a un tema indicado. Por lo tanto, un
buen SRI debería cumplir una serie de requisitos:
-
Cobertura: que recuperase
todos los documentos referentes al tema indicado.
-
Precisión: que garantizara
que los documentos recuperados fuesen relevantes.
-
Multilingualidad: que la
localización del documento fuese independiente del idioma en el que
estuviese escrito.
|
12 |
OP |
| 60464 |
TRABAJO SOBRE EXTRACCIÓN DE INFORMACIÓN E INSERCIÓN EN BASES DE DATOS
Prof. Manuel Palomar Sanz
Prof. Antonio Ferrández Rodríguez
Descripción:
Se
pretende que el alumno construya un sistema de extracción de
información (SEI) relevante a partir de textos. Para ello será
necesario estudiar los diferentes sistemas de extracción de
información existentes así como las diferentes propuestas.
Posteriormente y tomando como base un sistema de procesamiento del
lenguaje natural orientado a la resolución de la anáfora, se
construirá un SEI que lo utilice para resolución de las posibles
correferencias lingüísticas.
|
12 |
OP |
| 60465 |
CONSTRUCCIÓN DE UN INTERFAZ EN LENGUAJE NATURAL PARA EL ACCESO A BASES DE
DATOS
Prof. Antonio Ferrández Rodríguez
Descripción:
Estudio
y desarrollo de una interfaz en lenguaje natural para el acceso
(definición y manipulación) a los datos de una base de datos (BD).
Para ello, en primer lugar, se estudiarán los recursos existentes
en el mercado así como los disponibles en el grupo de investigación
que puedan formar parte de esta interfaz. En segundo lugar, se
contruirá el sistema de procesamiento del lenguaje natural; este
sistema tomará como entrada una frase en lenguaje natural y la
traducirá a un lenguaje formal (en este caso a una sentencia SQL).
La salida del sistema (SQL) accederá a la BD, la cual devolverá una
respuesta. Se mostrará la respuesta de la BD, no será necesario
generar la respuesta en lenguaje natural.
|
12 |
OP |
| 61347 |
CONSTRUCCIÓN Y PERSONALIZACIÓN DE UN SERVIDOR DE APLICACIONES PARA COMERCIO
ELECTRÓNICO
Prof. Jaime Gómez Ortega
Descripción:
El
crecimiento en el uso de las nuevas tecnologías y de la WWW en
general está teniendo un impacto significativo en los sistemas de
información de sectores tales como comercio, industrias, bancos,
finanzas, educación, gobierno, entretenimiento he incluso en
nuestro trabajo y vida privada. A medida que el número y
complejidad de las aplicaciones basadas en red crece, se hace
necesario reflexionar acerca de la forma en la cual éstas deben ser
creadas y cómo mantener su calidad e integridad.
Este trabajo de
investigación tiene como propósito general la aplicación de métodos
y técnicas orientadas a objetos para el modelado, diseño e
implantación de aplicaciones de comercio electrónico. En el trabajo
se prestará especial importancia a las características especiales
del nuevo medio, los escenarios y entornos operacionales y la
multitud de perfiles de usuario que diferencian el desarrollo de
aplicaciones basadas en web respecto a desarrollo 'tradicional' del
software.
|
12 |
OP |
| 61348 |
HERRAMIENTAS PARA GENERAR INTERFACES CLIENTE DE APLICACIONES WEB INDEPENDIENTES DEL
DISPOSITIVO (PC'S, WAP, WEBTV, PDA'S)
Prof. Jaime Gómez Ortega
Descripción:
El
diseño de interfaces de usuario independiente de dispositivo que
conecten de forma precisa con módulos de lógica preexistentes es un
requisito básico en el desarrollo de aplicaciones web. El propósito
de este trabajo de investigación consiste en profundizar (haciendo
uso de principios de ingeniería) sobre distintas aproximaciones
sistemáticas y disciplinadas que permiten abordar con éxito el
modelado y prototipado de espacios de navegación heterogéneos en
aplicaciones web. La propuesta utilizará en paradigma orientado a
objetos como punto de partida para enlazar el interface con la
lógica de aplicación preexistente y se centrará en la producción de
interfaces de usuario para PC's y dispositivos móviles.
|
12 |
OP |
| 62028 |
ASPECTOS LINGÜÍSTICOS DEL DISEÑO DE SISTEMAS DE TRADUCCIÓN AUTOMÁTICA
Prof. Mikel L. Forcada Zubizarreta
Descripción:
Si se formula un proceso de
traducción automática ideal como una mecanización del principio de
composicionalidad semántica, se pueden examinar des de un punto de
vista lingüístico y traductológico las aproximaciones a este
principio más usadas para convertir un traductor automático idel en
un sistema real (los modelos o estrategias más comunes de
traducción) y identificar algunas de las tensiones que se pueden
producir en el desarrollo de un sistema de traducción automática
real. Se da el caso que, para poder construir un sistema de
traducción automática últil son inevitables dos tareas: de una
parte, una reflexión detallada sobre los mecanismos lingüísticos de
la traducción para identificar regularidades y mecanismos
programables como datos y reglas en un programa y, de otra parte,
hacer numerosas aproximaciones, establecer compromisos difíciles e
incluso hacer dolorosos sacrificios respecto del que sería un
modelo ideal y lingüísticamente justificable, para poderlo
convertir en un sistema que funcione de manera aceptable.
El conocimiento detallado del diseño lingüístico y
traductológico de las estrategias usadas por los sistemas reales de
traducción automática (muchos de los cuales usan estrategias
protegidas y no desveladas) es de gran ayuda. De una parte, sirve
para evaluarlos detalaldamente y así determinar l'adecuación en las
diversas aplicaciones reales y, por otra parte, puede servir para
decubrir posibles vías de mejora, especialmente si consideramos que
los sistemas reales no han aprovechado completamente la potencia de
la colaboración entre lingüístas, traductores e informáticos. Los
trabajos de investigación adscritos a esta materia explorarán los
diversos aspectos lingüísticos de los sistemas reales y posibles de
traducción automática.
Descripció:
Si es formula un
procés de traducció automàtica ideal com una mecanització del
principi de composicionalitat semàntica, es poden examinar des d'un
punt de vista lingüístic i traductològic les aproximacions a aquest
principi més usades per a convertir un traductor automàtic ideal en
un sistema real (els models o estratègies més comunes de traducció)
i identificar algunes de les tensions que es poden produir en el
desenvolupament d'un sistema de traducció automàtica real. Es dóna
el cas que, per a poder construir un sistema de traducció
automàtica útil son inevitables dos tasques: d'una banda, una
reflexió detallada sobre els mecanismes lingüístics de la traducció
per a identificar regularitats i mecanismes programables com
a dades i regles en un programa i, d'altra banda, fer nombroses
aproximacions, establir difícils compromisos i fins i tot fer
dolorosos sacrificis respecte del que seria un model ideal i
lingüísticament justificable, per a poder-lo convertir en sistema
que funcione de manera acceptable.
El coneixement detallat del disseny lingüístic i
traductològic de les estratègies usades pels sistemes reals de
traducció automàtica (molts dels quals usen estratègies
protegides i no desvelades) es de gran ajuda. D'una banda, serveix
per a avaluar-los detalladament i així determinar l'adequació
en les diverses aplicacions reals i, d'altra banda, pot servir per
a descobrir possibles vies de millora, especialment si
considerem que els sistemes reals no han aprofitat completament la
potència de la col·laboració entre lingüistes, traductors i
informàtics. Els treballs d'investigació adscrits a aquesta matèria
exploraran els diversos aspectes lingüístics dels sistemes reals i
possibles de traducció automàtica.
|
12 |
OP |
| 62099 |
GENERACIÓN AUTOMÁTICA DE
CÓDIGO PARA PROCESOS ETL EN ALMACENES DE DATOS A PARTIR DE UNA
EXTENSIÓN UML
Prof. Juan Carlos Trujillo Mondejar
Descripción:
En una arquitectura de
almacenes de datos, los procesos ETL (Extracting, Transforming and
Loading) son los encargados de extraer de las fuentes de datos
operacionales los datos que contendrá el repositorio del almacen de
datos. Una vez extraidos los datos, estos procesos ETL realizan las
transformaciones necesarias cargandolos posteriormente en el
almacén de datos.
En la actualidad, el diseño y mantenimiento de estos procesos es un
aspecto crítico en la configuración de una arquitectura de
almacenes de datos. En la practica, estos procesos ETL se programan
en el lenguaje 4GL de la plataforma destino donde se implantara el
almacen de datos. De esta forma, la unica documentacion existente
para su gestión y mantenimiento son el código de estos procesos en
si. Una consecuencia inmediata de esta forma de proceder es que la
detección de errores en la carga de datos (muy comunes en los
almacenes de datos) es muy compleja.
En nuestro grupo de investigacion hemos estado trabajando en la
propuesta de una aproximacion de modelado conceptual basada en UML
para especificar estos procesos ETL. De esta forma, desde la
primera fase de diseño se dispone de una aproximación formal que
facilita el diseño, configuración y mantenimiento de estos
procesos.
El objetivo del trabajo es extender esta propuesta de modelado de
procesos ETL basada en UML para que genere el código necesario
dependiendo de la plataforma destino donde se implante el almacén
de datos. Para ello, se definirán unos patrones de modelado
conceptual donde quede especificado la correspondencia exacta entre
los constructores de modelado conceptual y su correspondiente
representacion en el lenguaje 4GL correspondiente.
|
12 |
OP |
| 62567 |
HERRAMIENTAS PARA MEDICIÓN DE CALIDAD EN APLICACIONES WEB
Prof. Cristina Cachero Castro
Descripción:
El
trabajo profundizará en los conceptos presentados en el curso
'Calidad en el Diseño de Aplicaciones Web'. Para ello, se
implementarán varias versiones de una aplicación en función de las
métricas que quieran ser validadas. Dichas versiones deberán llevar
embebida la lógica necesaria para capturar tiempos de acceso. El
objetivo es la validación empírica de en qué medida cada factor de
los evaluados influye en la apreciación externa de 'calidad' por
parte del usuario.
|
12 |
OP |
| 62574 |
CONSTRUCCIÓN DE ONTOLOGÍAS PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL Y LA WEB SEMÁNTICA
Prof. Maximiliano Saiz Noeda
Prof. Andrés Montoyo Guijarro
Prof. Armando Suárez Cueto
Descripción:
- Uso de ontologías para
simplificar el acceso a la información
- Creación automática de
ontologías de dominio a partir de ontologías genéricas
- Construcción de ontologías a
partir de recursos multilingües
- Extracción de conocimiento
ontológico de dominios concretos a partir de la web
|
12 |
OP |
| 62575 |
LABORATORIO DE EXTRACCIÓN DE INFORMACIÓN TEXTUAL
Prof. Rafael Muñoz Guillena
Prof. Patricio Martínez Barco
Prof. Armando Suárez Cueto
Descripción:
- Descripción de las
arquitecturas más comunes de los sistemas de extracción de
información textual
- Desarrollo de recursos
independientes del tipo de información a extraer
- Desarrollo de recursos
dependientes del tipo de información a extraer
- Utilización de ontologías de
dominio
- Desarrollo de un sistema de
extracción de información sobre un dominio específico
|
12 |
OP |
| 62576 |
INTERFACES DE LENGUAJE NATURAL
Prof. Patricio Martínez Barco
Prof. Rafael Muñoz Guillena
Descripción:
- Creación de herramientas para
el reconocimiento de lenguaje natural
- Creación de herramientas para
la generación del lenguaje.
- Desarrollo de sistemas de
diálogo.
|
12 |
OP |
| 62577 |
DESARROLLO DE SISTEMAS DE BÚSQUEDA DE RESPUESTAS
Prof. José Luis Vicedo González
Programa:
- Introducción.
- ¿Qué es un sistema de
búsqueda de respuestas?
- Contexto histórico. Áreas
relacionadas
- Aplicaciones
- Sistemas de búsqueda de
respuestas
- Arquitectura general de los
sistemas
- El análisis de la pregunta
- La recuperación de documentos
- La extracción de la respuesta
- Taxonomia de los sistemas de
búsqueda de respuestas
- Clasificaciones
- Estudio de las diferentes aproximaciones
- Principales líneas de
desarrollo
|
12 |
OP |
| 62578 |
BÚSQUEDA DE INFORMACIÓN BASADA EN PASAJES
Prof. Fernando Llopis Pascual
Objetivos pedagógicos:
- Construir un sistema de
recuperación de información basado en pasajes.
- Evaluar dicho sistema en
función de su precisión y cobertura.
- Comparar dicho sistema con
otros existentes en la literatura existente.
|
12 |
OP |
| 62579 |
RECUPERACIÓN DE INFORMACIÓN MULTILINGüE
Prof. Jesús Peral Cortés
Prof. Antonio Ferrández Rodríguez
Descripción:
Uno
de los problemas pendientes de resolver en los buscadores de
información existentes en la actualidad es el afrontar el problema
de la multilingualidad. Este problema consiste en poder realizar
búsquedas de información independientemente del idioma en el que se
presente tanto la pregunta del usuario como los documentos sobre
los que se realiza la búsqueda. Por ello se pretende en este curso
que el alumno estudie el estado del arte de los sistemas que
intentan abordar este problema, para a partir de las soluciones
existentes aporte su aproximación al problema. Dicha solución se
deberá evaluar y comparar con otros sistemas similares.
|
12 |
OP |
| 63039 |
TRABAJO SOBRE APRENDIZAJE CON DATOS ESTRUCTURADOS
Prof. José Oncina Carratalá
Prof. Jorge Calera Rubio
Descripción:
Estudio y desarrollo de
algoritmos que permitan, a partir de muestras representativas de
datos estructurados, la construcción automática de sistemas de
descripción de dichos datos (gramáticas, autómatas o, en general
sistemas formales) para su utilización en tareas de: corrección
sintáctica, compresión, traducción automática, bioinformática,
minería de datos, eliminación de ruido, etc.
|
12 |
OP |
| 63040 |
APLICACIÓN DE LA INTELIGENCIA ARTIFICIAL A LECTURA AUTOMÁTICA Y MARCADO ESTRUCTURAL
DE TEXTOS
Prof. Rafael Carlos Carrasco Jiménez
Descripción:
Se trata de implementar alguna herramienta para alguna de las
siguientes tareas:
- Etiquetado semiautomático de
textos.
- Indexación de estructuras e
integración con diccionarios para la búsqueda de información en
textos etiquetados. Simplificación y
especialización automática de DTD (Document Type
Definition).
- Otras herramientas que
permitan aprovechar el marcado estructural, por ejemplo para la
recuperación de información.
|
12 |
OP |
.
|