Universidad de Alicante _ EPSA
Departamento de Lenguajes y Sistemas Informáticos

Principal » Doctorado » Estructura del programa de doctorado para el curso 2008-2009

Estructura del programa de doctorado para el curso 2008-2009

Código de programa:5099
Dpto. coordinador:Lenguajes y Sistemas Informáticos
Dptos. Responsables:Lenguajes y Sistemas Informáticos
Director del programa:Jesús Peral Cortés
Nº mínimo de alumnos:10
Nº máximo de alumnos:--
Áreas de conocimiento:Lenguajes y Sistemas Informáticos

Tribunal de suficiencia investigadora:

Presidente:José María Oncina CarrataláSuplente:Augusto Beléndez Vázquez
Vocal 1:Manuel Palomar Sanz Suplente:Mikel L. Forcada Zubizarreta
Vocal 2:Fernando Torres Medina Suplente:Antonio Ferrández Rodríguez

Criterios de admisión:

  1. Expediente académico: 25%
  2. Calificación en asignaturas de licenciatura correspondientes al área o perfil del programa: 50%
  3. Trabajos y seminarios realizados en relación al área o perfil del programa: 25%
  4. Universidad de la licenciatura: 0%

PERÍODO DE DOCENCIA

(14 cursos de 4 créditos cada uno, 13 cursos fundamentales y 1 metodológico)
  1. TECNOLOGÍAS DEL LENGUAJE HUMANO

    (cód. 62571. Curso fundamental)

    Impartido por:

    • Manuel Palomar Sanz
    • Antonio Ferrández Rodríguez
    • Lidia Moreno Boronat

    Programa:

    1. Preliminares del Procesamiento del Lenguaje Natural
    2. Análisis léxico
    3. Análisis sintáctico
    4. Interpretación semántica
    5. Interpretación contextual
    6. Disertaciones bibliográficas

    Objetivos pedagógicos:

    • Introducir al alumno en el campo de investigación de la comprensión del "lenguaje natural".
    • Formar al alumno en los fundamentos teóricos de la disciplina, preparándole de esta manera para el estudio y desarrollo de la tecnología apropiada a cada aplicación, así como para la asimilación de los cambios futuros.
    • Estudiar los módulos que componen cualquier aplicación del PLN: análisis léxico, sintáctico y semántico.
    • Estudiar las aplicaciones que necesitan del PLN: traducción automática, acceso a Bases de Datos, extracción de información en Bases de Datos, recuperación o búsqueda de información

    Metodología utilizada:

    • Clases magistrales combinadas con seminarios participativos que fomenten la interacción y mejoren el aprendizaje
    • Uso de métodos audiovisuales avanzados

    Criterios de evaluación:

    • La calificación se fundamentará en la evaluación continua que combine la asistencia a clase, la propuesta de trabajos sobre la materia estudiada y las disertaciones bibliográficas

    Bibliografía más relevante recomendada:

    • Introducción al Procesamiento del lenguaje Natural. L. Moreno, M. Palomar, A. Molina, A.Ferrández. Servicio de publicaciones de la Universidad de Alicante. 1999
    • Tecnologías del Lenguaje. Martí, M.A. Et al. Editorial UOC. 2003
    • The Oxford Handbook of Computational Linguistics. Oxford University Press. 2003
    • Natural Language Understanding. J. Allen. The Benjamin/cummings Publishing Company. 1995
    • Natural Language processing for prolog programmers. M. Covington. Prentice Hall. 1994
  2. EXTRACCIÓN DE INFORMACIÓN TEXTUAL

    (cód. 62572. Curso fundamental)

    Impartido por:

    • Manuel Palomar Sanz
    • Rafael Muñoz Guillena
    • Patricio Manuel Martínez Barco
    • Horacio Rodríguez Hontoria

    Programa de teoría:

    1. Introducción a la Extracción de Información
    2. El Procesamiento del Lenguaje Natural en la Extracción de Información
    3. Extracción de información
      • Aplicaciones de EI
      • Bibliotecas digitales: Una fuente de información que requiere extracción de información automática
    4. Tareas de los sistemas de EI
    5. Reconocimiento de Entidades
    6. Resolución de la correferencia
    7. Definición y relleno de plantillas
    8. Aplicaciones de la Extracción de Información

    Programa de prácticas:

    1. Propuesta de un dominio de trabajo
    2. Definición de plantillas
    3. Análisis de requisitos.
      • Propuesta de uso de herramientas.
      • Propuesta de uso de recursos
    4. Construcción de un Sistema de Extracción de Información

    Objetivos pedagógicos:

    • Introducción a la temática de la Extracción de Información (EI)
    • El Procesamiento del Lenguaje Natural (PLN) en la EI
    • Capacidades de los sistemas de EI
    • Necesidades de los sistemas de EI
    • Conocimiento de técnicas para transformar información no estructurada en estructurada
    • Conocer recursos que proporcionan la información necesaria a un sistema de extracción de información
      • Etiquetadores
      • Bases de datos léxicas (WordNet, ...)
      • Analizadores
    • Presentar sistemas de extracción de información
      • SOCIS
      • LaSIE
      • PROTEUS
      • EXIT

    Metodología utilizada:

    • Aprendizaje constructivista. Las sesiones se planifican como una mesa redonda en la que el profesor expone unos conceptos teóricos que posteriormente son abordados entre todos (profesor y alumnos)

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Information Extraction. J. Cowie and W. Lehnert. Communications of ACM 1996
    • Information Extraction: Technique and Challenges. R. Grishman. In Maria Teresa Pazienzia (Ed.). LNCS, 1299:10-27. Springer-Verlag 1997
    • Cross Lingual Information Extraction and Automated text Summarization. E. Hovy. Chapter III of Multilingual Information Management: Current Levels and Future Abilities 1999
    • Introduction to Information Extraction technology. D.E. Appelt and D.J. Israel. Tutorial for IJCAI 1999
    • Empirical Methods in Information Extraction. C. Cardie. AI Magazin Winter 1997
    • Information Extraction a User Guide. H. Cunningham. Research Memo CS-97-02. Univ. Sheffield 1997
    • Information Extraction as a core language technology. What is IE?. Y. Wilks. In Maria Teresa Pazienzia (Ed.). LNCS, 1299:10-27. Springer-Verlag 1997
    • Information Extraction. J. Cowie, Y. Wilks. In R. Dale, H. Moisl and H. Somers (eds.) The Handbook of Natural Language Processing. 2000.
    • Customization of Information Extraction Systems. R. Yangarber and R. Grishman. In Maria Teresa Pazienzia (Ed.). LNCS, 1299:10-27. Springer-Verlag 1997
    • Inferential Information Extraction. M. Vilain. Proceeding of ACL 1999
    • MUC-6
    • MUC-7
  3. BÚSQUEDAS INTELIGENTES DE INFORMACIÓN EN LA WEB

    (cód. 61338. Curso fundamental)

    Impartido por:

    • Antonio Ferrández Rodríguez
    • Jesús Peral Cortés
    • Fernando Llopis Pascual
    • Luis Alfonso Ureña López

    Programa:

    1. Introducción.
    2. Sistemas de búsqueda de información (Information Retrieval). Estado del arte.
    3. Incorporación de técnicas de lenguaje natural a los buscadores de información.
    4. Sistemas de búsqueda de respuesta (Question Answering).
    5. Recuperación de información multilingüe (Cross Language Information Retrieval).

    Objetivos pedagógicos:

    • Conocer el funcionamiento de los buscadores de información.
    • Mejorar su funcionamiento: precisión y calidad de los resultados devueltos.
    • Aplicar técnicas de procesamiento del lenguaje natural a estos buscadores.
    • Permitir búsquedas sobre preguntas concretas escritas en lenguaje natural, y no únicamente limitarnos a búsquedas por palabras clave.
    • Ir un paso más allá de lo que realizan los buscadores tradicionales, para ello, contestar a las preguntas del usuario. Es decir, en lugar de devolver el documento completo, devolver la zona del texto donde se encuentra la información requerida. Este proceso se denomina Question Answering o Búsqueda de Respuestas dentro del campo de estudio de la Lingüística Computacional.
    • Introducir las técnicas que permiten añadir una capacidad de trabajo multilingüe a los buscadores.

    Metodología utilizada:

    • El curso tendrá una base teórica que se pondrá en práctica sobre diferentes sistemas de recuperación de información. Se trabajará sobre textos principalmente en inglés aunque se estudiará su aplicación sobre el español.
    • Clases magistrales y prácticas de laboratorio.

    Criterios de evaluación:

    • La calificación final se basará en el trabajo del alumno realizado durante los ejercicios de clase y las prácticas de laboratorio.

    Bibliografía más relevante recomendada:

    • Modern Information Retrieval. Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley. 1999.
    • Introduction to modern information retrieval. G. G. Chowdhury. Library Association Publishing London. 1999.
    • Curso de la UNED: IR & NLP Course
    • INFORMATION RETRIEVAL BOOK: C. J. van RIJSBERGEN.
  4. ENTORNOS AVANZADOS DE PRODUCCIÓN DE SOFTWARE PARA AMBIENTES WEB

    (cód. 62569. Curso fundamental)

    Impartido por:

    • Jaime Gómez Ortega
    • Antonio Vallecillo Moreno

    Programa:

    • Entornos avanzados de producción de software
      • Modelo Conceptual
      • Semántica de acciones
      • Modelo de Ejecución
    • Compiladores de modelos
      • Generación de estructura
      • Generación de comportamiento
      • Generación de arquitectura
    • Introducción a la Ingeniería Web (Web Engineering)
      • El Método OO-H
      • VisualWADE un entorno CASE para construir aplicaciones web

    Objetivos pedagógicos:

    • Dotar al alumno de conocimientos generales y especializados en entornos de producción de software y más concretamente en aquellos especializados en Ingeniería Web.
    • Conocer cómo los lenguajes basados en semántica de acciones pueden ayudar a traducir las propiedades conceptuales del sistema de información en un lenguaje de programación destino.
    • Explicar la importancia de los compiladores de modelos en el proceso de construcción/generación del software.
    • Introducir el estándar MDA como elemento clave para describir los aspectos de arquitectura del sistema de sistema de información.
    • Aplicar las técnicas sobre el método OO-H de diseño de aplicaciones web.
    • Observar los resultados que se obtienen en un entorno avanzado de producción de software web como VisualWADE.

    Metodología utilizada:

    • Clases magistrales combinadas con seminarios participativos que fomenten la interacción y mejoren el aprendizaje

    Criterios de evaluación:

    • La evaluación de este curso de doctorado se compone de dos entregas:
      • Entrega 1: Informe de valoración de las capacidades de producción de código de alguna de las herramientas disponibles en el mercado indizada en la lista de herramientas CASE de la Software Engineering Virtual Library. Valor 50% de la nota final.
      • Entrega 2: Diseño y generación automática de un sistema de información complejo basado en web utilizando la herramienta VisualWADE. Valor: 50% de la nota final.

    Bibliografía más relevante recomendada:

    • Executable UML: A Foundation for Model Driven Architecture. Stephen Mellor, Marc Balcer. Addison-Wesley, 2003.
    • The Object Constraint Language: Getting Your Models Ready for MDA, Second Edition. Jos Warmer, Anneke Kleppe. Addison-Wesley, 2003.
    • Building Web Applications with UML (2nd Edition). Jim Conallen. Addision-Wesley, 2002.
    • J. Gómez, C. Cachero, O. Pastor. Conceptual Modeling of Device-Independent Web Applications. IEEE Multimedia 8(2): 20-32. 2001
    • J. Gómez. Next Generation of CASE tools for the Web: The VisualWADE project. Software and Web Engineering in the Microsoft .NET Environment. Cambridge, UK. March 25-28, 2003.
  5. COMPUTACIÓN AVANZADA PARA MÚSICA POR ORDENADOR

    (cód. 62303. Curso fundamental)

    Impartido por:

    • José Manuel Iñesta Quereda
    • Xavier Serra Casals
    • Ramón López de Mántaras

    Programa:

    1. Física, matemática y notación de la música
    2. Percepción de la música
    3. Lenguajes de síntesis digital
    4. Representación y recuperación de información musical
    5. Reconocimiento de formas para percepción
    6. Composición automática
    7. Interpretación automática

    Objetivos pedagógicos:

    • Familiarizar al alumno con las líneas de investigación más activas en música por computador y dotarle de herramientas que pueda utilizar en este área de investigación.
    • Conocer técnicas de representación y recuperación de la información tanto sonora como simbólica.
    • Conocer los trabajos más destacados en las líneas de investigación en inteligencia artificial aplicada a la música como son los relacionados con la percepción, la interpretación y la composición automáticas.

    Metodología utilizada:

    • El curso consta de sesiones teóricas y prácticas, que se reparten aproximadamente al 50% los créditos del curso.
    • Teoría: Las sesiones teóricas se llevan a cabo en el aula y al final de cada uno de los temas del curso el alumno recibirá un cuestionario con preguntas y ejercicios relativos al tema finalizado, que debe devolver cumplimentado al principio de la siguiente sesión.
    • Prácticas: Las sesiones prácticas se reparten (también en dos partes iguales) entre el laboratorio (prácticas con ordenador evaluadas in situ) y en un trabajo final que el alumno debe realizar bajo la supervisión del profesor responsable del curso.

    Criterios de evaluación:

    • Para aprobar el curso es necesaria la asistencia a clase, la devolución correctamente cumplimentada de todos los cuestionarios teóricos y prácticos, la realización de las prácticas y la realización del trabajo final de curso. En el caso más sencillo este trabajo será de tipo resumen bibliográfico para optar a la nota "aprobado".
    • Opcionalmente, se propondrán trabajos de investigación aplicada sobre las materias del curso para optar a calificaciones superiores a la de "aprobado".

    Bibliografía más relevante recomendada:

    • J. Pierce. "Los Sonidos de la Música". Prensa Científica, 1990
    • Roads, C. "The Computer Music Tutorial". MIT Press, 1996
    • Boulanger, R. "The CSound Book". MIT Press, 2000.
    • Schwanauer, M and Levitt, D.A. "Machine Models of Music". MIT Press, 1993.
    • Griffith, N. And Todd, P.M. "Musical Networks". MIT Press 1999.
  6. CALIDAD EN EL DISEÑO DE APLICACIONES WEB

    (cód. 62566. Curso fundamental)

    Impartido por:

    • Cristina Cachero Castro
    • Marcela Genero Bocco

    Programa:

    • Con el avance de Internet como entorno preferido por muchas organizaciones para el desarrollo de aplicaciones cada vez más complejas en términos de contenido, estructura, comportamiento e interfaz, se ha hecho patente la necesidad de técnicas que no sólo ayuden en su construcción sino que garanticen que el producto resultante (aplicación Web) se adhiere a determinados criterios de calidad. El estudio y aplicación de dichos criterios (intuitividad de la estructura navegacional, rendimiento, accesibilidad, etc.) es un campo emergente dentro de la Ingeniería del Software. En este curso, tras revisar las técnicas de modelado hipermedial existentes en la actualidad, se presentarán los principales modelos y estándares de calidad existentes. A continuación presentaremos las modificaciones que son necesarias para adaptar estos modelos a la idiosincrasia de las aplicaciones Web. Por último, presentaremos un conjunto de técnicas de evaluación experimiental que permiten demostrar la validez de las métricas de calidad propuestas.

    Objetivos pedagógicos:

    • Aportar al alumno una visión general del trabajo realizado hasta el momento en el campo de la Ingeniería Web
    • Conseguir que el alumno desarrolle una visión crítica acerca del proceso de desarrollo de una aplicación Web, y valore la aplicación de técnicas ingenieriles para su construcción y puesta en marcha.
    • Conseguir que el alumno disponga de las herramientas necesarias para evaluar interfaces hipermediales existentes, y poder subsanar por adelantado problemas de facilidad de uso que se puedan producir.

    Metodología utilizada:

    • En este curso se combinará la técnica de clase magistral (útil para introducir al alumno en la materia) con clases donde, tras una breve charla introductoria por parte del profesor, el alumno, en grupos, trabajará en distintos aspectos del temario basándose en material (principalmente artículos) proporcionado en clase. Al final de cada sesión se realizará una puesta en común donde cada alumno expondrá las principales conclusiones a las que ha llegado. Dichas exposiciones serán evaluadas por el profesor, y puntúan un 50% de la nota final del alumno.

    Criterios de evaluación:

    • Cada alumno presentará al final del curso un trabajo de investigación donde aplique las técnicas aprendidas en el curso a una aplicación Web real y evalúe los resultados obtenidos. La nota obtenida con este trabajo promediará con la nota que cada alumno tenga como resultado de una evaluación continua. Esta evaluación continua se basará en el grado de participación del alumno en las clases y en la calidad de sus presentaciones durante el curso.

    Bibliografía más relevante recomendada:

    • Fenton, N. y Pfleeger, S. L. (1997). Software Metrics: A Rigorous Approach 2nd. edition. London. Chapman & Hall.
    • Genero M., Piattini M. y Calero C. (eds.). Metrics for Software Conceptual Models. (2004). Imperial College Press, Londres.
    • Juristo N. and Moreno A.Mª. (2001) Basics of Software Engineering Experimentation, Kluwer Academic Publishers.
    • Kan. S. Metrics and Models in Software Quality Engineering. EEUU, Addison-Wesley.
    • Piattini M., Calero C. y Genero M. (eds.) (2002). Information and database quality. Kluwer Academic Publishers, Norwell, EEUU.
    • Wohlin C., Runeson P., Höst M., Ohlson M., Regnell B. y Wesslén A. (2000) Experimentation in Software Engineering: An Introduction, Kluwer Academic Publishers.
  7. ESTUDIO Y APLICACIÓN DE TÉCNICAS DE RECONOCIMIENTO DE FORMAS

    (cód. 62302. Curso fundamental)

    Impartido por:

    • María Luisa Micó Andrés
    • José María Oncina Carratalá
    • Pierre Dupont

    Programa:

    1. Introducción al reconocimiento de formas.
    2. Métodos estadísticos.
      • Técnicas supervisadas.
        • aproximación paramétrica.
        • aproximación no paramétrica.
      • Técnicas no supervisadas.
    3. Métodos sintácticos.
      • Métodos basados en gramáticas regulares.
        • Autómatas estocásticos
        • Modelos de Markov
      • Métodos basados en gramáticas incontextuales.
      • Otros Métodos.
    4. Selección y extracción de características.

    Objetivos pedagógicos:

    • Dar a conocer al alumno la linea de investigación de reconocimiento de formas
    • Dar a conocer los diferentes campos en los que se pueden aplicar las técnicas de reconocimiento de formas.
    • Conocer las distintas aproximaciones: estadística y sintáctica y saber decidir para cada problema cuál es la mejor elección.

    Metodología utilizada:

    • Clases magistrales alternadas con clases prácticas. Además, se pretende establecer foros de discusión donde el objetivo principal es el intercambio de opiniones, ya sobre trabajos de investigadores en el tema, como de trabajos realizados por los propios alumnos.

    Criterios de evaluación:

    • La asistencia a clase, junto al desarrollo de algún pequeño trabajo práctico y la participación activa en los foros de discusión, ya realizando una presentación de un trabajo propio o de un investigador en el tema es suficiente para aprobar la asignatura. La elaboración de un trabajo de investigación (implementación y estudio) permitirá obtener una nota elevada.

    Bibliografía más relevante recomendada:

    • Pattern Clasification, 2nd edition. Richard O. Duda, Peter E. Hart, David G. Stork. John Wiley & Sons, 2000.
    • Syntactic Pattern Recognition, an Introduction. Rafael C. Gonzalez, Michael G. Thomason. Addison-Wesley Publishing Company, 1978.
  8. TRADUCCIÓ AUTOMÀTICA: FONAMENTS I APLICACIONS

    (cód. 61726. Curso fundamental)

    Impartido por:

    • Mikel L. Forcada Zubizarreta
    • Juan Antonio Pérez Ortiz

    Programa:

    • Introducción
    • ¿Qué se entiende por traducción?
    • Aplicaciones de la traducción automática: asimilación y diseminación, preedición y postedición, lenguajes controlados.
    • Ambigüedad y problemas relacionados: el principio de composicionalidad; ambigúedad lèxica, sintáctica y mixta; otras fuentes de ambigüedad; problemas de generación, de transferencia y de descripción.
    • Técnicas de traducción automática deductiva: el modelo de transferencia (morfológica, sintáctica, semántica); el modelo de interrlingua.
    • La traducción automàtica real: entre la aplicación ideal del principio de composicionalidad semántica y el modelo palabra por palabra.
    • Programación (totalmente o parcialmente inductiva) de traductores automàticos (memorias de traducción, sistemas estadísticos, sistemas basados en ejemplos)
    • Evaluación de la traducción automática.

    Objetivos pedagógicos:

    • Hacerse conscientes de las aplicaciones posibles de la traducción automática y de los problemas que comporta
    • Conocer los conceptos lingüísticos básicos para discutir los problemas y las soluciones (morfología, sintaxis, semántica, etc.)
    • Conocer las operaciones y las estructuras lingüístico-computacionales sobre las que se basan los sistemas de TA (analizadores, diccionarios, gramáticas)
    • Conocer el estado actual de la cuestión y las soluciones más sobresalientes (sistemas de transferencia, de interlingua, estadísticos, híbridos)
    • Hacerse conscientes de la complejidaa intrínseca de la traducción automática y de sus causas
    • Ser capaces de implementar ejemplos de algunos de los módulos que forman parte de los sistemas de TA

    Metodología utilizada:

    • Además de las sesiones de aula, que se procurará que sean tan participativas como se posible, en cada sesión de laboratorio se propondrá una actividad concreta de análisis de software existente o de creación de programas.

    Criterios de evaluación:

    • Para superar el curso se debe asistir regularmente a las sesiones de aula y de laboratorio e involucrarse activamente en su desarrollo y presentar los trabajos que se encarguen. La participación del alumnado en las actividades influirá sobre su calificación.

    Bibliografía más relevante recomendada:

    • Arnold, D., Balkan, L., Meijer, S., Humphreys, R.L., Sadler, L. (1994) Machine Translation: an Introductory Guide, Oxford: NCC Blackwell
    • Bouillon, P., Clas, A., eds. (1993) La Traductique, Montréal: Presses de l'Université
    • Hutchins, W.J., Somers, H.L. (1992) An Introduction to Machine Translation, London: Academic Press.
    • Loffler-Laurian, A.M. (1996) La traduction automatique, Villeneuve d'Ascq: Presses Univ. Septentrion
    • Newton, J., ed. (1992) Computers in translation: a practical appraisal, London: Routledge.
    • Sager, J.C. (1993) Language Engineering and Translation: Consequences of automation, Amsterdam: Benjamins
    • Somers, H., ed. (2003) Computers in Translation: A translator's guide, Amsterdam: Benjamins.
    • Trujillo, A. (1999) Translation engines: techniques for machine translation, Londres: Springer-Verlag.
  9. XML, MARCADO DE TEXTOS Y BIBLIOTECAS DIGITALES

    (cód. 62565. Curso fundamental)

    Impartido por:

    • Rafael C. Carrasco Jiménez

    Programa:

    • Caracterización matemática de XML
    • XML y bases de datos
    • Autómatas de árboles para XML
    • Simplificación y especialización de esquemas
    • Indexadores y buscadores para XML
    • Inferencia de DTD
    • Marcado automático de textos

    Objetivos pedagógicos:

    • Conocer cómo se utilizan y definen lenguajes de marcado así como nuevas técnicas de búsqueda, de transformación y recuperación de la información para este tipo de textos.
    • Comprender los trabajos y las líneas de investigación originadas a partir de estos temas.

    Metodología utilizada:

    • Las actividades que se desarrollarán son:
      • Seminarios breves de introducción.
      • Prácticas sobre el ordenador tras cada seminario
      • Lectura y resumen de un artículo de investigación y presentación oral en clase.
      • Implementación de herramientas y algoritmos y realización de un informe.

    Criterios de evaluación:

    • Se evaluará la calidad de la presentación del artículo asignado a cada alumno así como la calidad del informe y programa realizados en als prácticas.

    Bibliografía más relevante recomendada:

    • Ron Schmelzer: XML and web services unleashed. SAMS 2002.
    • Neil Bradley: The XML companion. Addison-Wesly 2000.
    • Elliotte R. Harold: XML bible. IDG Books 1999.
  10. TÈCNIQUES AVANÇADES EN TRADUCCIÓ AUTOMÀTICA

    (cód. 61728. Curso fundamental)

    Impartido por:

    • Mikel L. Forcada Zubizarreta
    • Rafael Carlos Carrasco Jiménez

    Programa:

    • Introducción
    • Procesamiento léxico en sistemas de TA: transductores de estados finitos (análisis morfológico, generación morfológica, transferencia léxica) diccionarios (diccionarios morfológicos y bilingües; diccionarios alineados y no alineados).
    • Procesamiento sintáctico: gramáticas, analizadores; análisis sintáctico parcial (chunking)
    • Desambiguación léxica categorial (PoS tagging): técnicas estadísticas y basadas en reglas.
    • Explotación de textos bilingües: alineamiento, extracción de diccionarios bilingües, traducción automática estadística.
    • Aspectos no lingüísticos de la traducción automática; formatos de los textos (preservación, tratamiento).

    Objetivos pedagógicos:

    • Conocer en profundidad algunas de las herramientas teóricas que subyacen a la implementación de los módulos de los sistemas de traducción automática.
    • Estudiar la implementación de estos módulos.
    • Ser capaz de implementar versiones reducidas de estos módulos en el laboratorio.

    Metodología utilizada:

    • Además de las sesiones de aula, que se procurará que sean tan participativas como se posible, algunas de las cuales estarán organizadas en torno a encargos de lectura y discusión de artículos, en las sesiones de laboratorio se implementarán módulos concretos de un sistema de traducción automática.

    Criterios de evaluación:

    • Para superar el curso se debe asistir regularmente a las sesiones de aula y de laboratorio, involucrarse activamente en su desarrollo y presentar los trabajos (teóricos y prácticos) que se encarguen. El nivel de desempeño del alumnado en estos trabajos determinará su calificación.

    Bibliografía más relevante recomendada:

    • Arnold, D., Balkan, L., Meijer, S., Humphreys, R.L., Sadler, L. (1994). Machine Translation: an Introductory Guide, Oxford: NCC Blackwell
    • Hutchins, W.J., Somers, H.L. (1992) An Introduction to Machine Translation, London: Academic Press.
    • Kornai, A., ed. (1999) Extended Finite State Models of Language. Cambridge University Press.
    • Manning, C.D. & Schütze, H (1999) Foundations of Statistical Natural Language Processing, MIT Press, Massachusetts
    • Roche, E. & Schabes, Y., eds. (1997) Finite-State Language Processing. MIT Press, Massachusetts.
    • Trujillo, A. (1999) Translation engines: techniques for machina translation, Londres: Springer-Verlag.
  11. DISEÑO Y EXPLOTACIÓN DE ALMACENES DE DATOS

    (cód. 62304. Curso fundamental)

    Impartido por:

    • Juan Carlos Trujillo Mondéjar
    • Mario Piattini Velthuis
    • Stefano Rizzi

    Programa de teoría:

    1. Almacenes de datos: introducción y motivación
    2. Arquitectura de almacenes de datos
      1. Fuentes de datos
      2. Procesos ETL (Extraction, Transformation, Loading)
      3. El almacén de datos (DW)
      4. Metadatos
      5. Servidor del almacén de datos
      6. Herramientas de consultas
    3. Diseño de un almacén de datos: visión práctica
      1. Diseño conceptual
      2. Diseño lógico
      3. Diseño físico
    4. Nuevas aproximaciones de modelado conceptual
      1. Estudio de diversas propuestas académicas
      2. .Extensión de UML de la Universidad de Alicante
    5. Calidad de almacenes de datos
      1. Métricas de calidad para modelos conceptuales y lógicos
    6. Seguridad y auditoría de almacenes de datos
    7. Explotación de almacenes de datos

    Programa de prácticas:

    1. Propuesta de un sistema de información
    2. Diseño del almacén de datos
      1. Diseño conceptual
      2. Diseño lógico
      3. Diseño físico
    3. Diseño de los procesos ETL
    4. Calidad de los modelos especificados
    5. Implantación del almacén de datos especificado mediante el uso de herramientas comerciales

    Objetivos pedagógicos:

    • Introducir los almacenes de datos
    • Conocer la arquitectura de un sistema de almacenes de datos y la relación de sus componentes
    • Diseñar un almacén de datos
    • Aplicar el Lenguaje de Modelado Unificado (Unified Modeling Language, UML) para el diseño conceptual de almacenes de datos
    • Estudiar y analizar la calidad de un almacén de datos
    • Explotar un almacén de datos
    • Construir un prototipo de almacenes de datos mediante el uso de herramientas comerciales

    Metodología utilizada:

    • Aprendizaje constructivista.
      • Las sesiones se planifican como una mesa redonda en la que el profesor expone unos conceptos teóricos y problemas a resolver mediante la aplicación de los primeros. Con posterioridad estos problemas y conceptos se abordan de forma dinámica entre el profesor y los alumnos.

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • The Data Warehouse Toolkit R. Kimball. Ed. John-Wiley, 2002 (ed. 3ª)
    • Building Data Warehouses. W. Inmon. Ed. John-Wiley, 2002 (ed. 3ª)
    • Building A Data Warehouse for Decision Support. Poe, V., Klauer, P., Brobst, S. Ed. Prentice-Hall. 1998.
    • OLAP Solutions. .Thomsen, E. Ed. John-Wiley, 2002 (ed. 2ª)
    • Ralph Kimball Associates and R. Kimball University. R. Kimball. http://www.ralphkimball.com/
    • Inmon.com LLC. W. Inmon. http://www.billinmon.com/
    • OLAP Council. http://www.olapcouncil.org/
    • The Data Warehouse Institute. http://www.dw-institute.com/
    • Colección de artículos de la extensión de UML de la Universidad de Alicante para el diseño conceptual de almacenes de datos
    • Oracle Warehouse Builder and Oracle OLAP. http://www.oracle.com/
    • Microsrategy. http://www.microstrategy.com/
  12. APRENDIZAJE CON DATOS ESTRUCTURADOS

    (cód. 62094. Curso fundamental)

    Impartido por:

    • Jorge Calera Rubio
    • José Oncina Carratalá
    • Colin de la Higuera

    Programa:

    • Introducción al Aprendizaje Inductivo.
    • Inferencia Gramatical: generalidades.
    • Métodos basados en gramáticas regulares.
    • Agrupamiento de estados.
    • Métodos incrementales.
    • Inferencia de transductores.
    • Métodos estadísticos.
    • Métodos basados en gramáticas incontextuales.

    Objetivos pedagógicos:

    • Dar a conocer al alumno las lineas de investigación de inferencia inductiva e inferencia gramatical en particular como paradigmas mas adecuados a la hora de abordar problemas de aprendizaje con datos estructurados.
    • Dar a conocer los diferentes campos en los que se pueden aplicar las técnicas de aprendizaje de datos estructurados.

    Metodología utilizada:

    • Clases magistrales alternadas con clases prácticas.
    • Además, se pretende establecer foros de discusión donde el objetivo principal es el intercambio de opiniones, ya sobre trabajos de investigadores en el tema, como de trabajos realizados por los propios alumnos.

    Criterios de evaluación:

    • La asistencia a clase, junto al desarrollo de algún pequeño trabajo práctico y la participación activa en los foros de discusión, ya realizando una presentación de un trabajo propio o de un investigador en el tema es suficiente para aprobar la asignatura. La elaboración de un trabajo de investigación (implementación y estudio) permitirá obtener una nota elevada.

    Bibliografía más relevante recomendada:

    • de la Higuera. A Bibliographical Study of Grammatical Inference Pattern Recognition, 2003, (y artículos citados)
    • Libros de actas de los congresos: ICGI, ALT, COLT.
  13. USO Y DISEÑO DE ONTOLOGÍAS EN PROCESAMIENTO DEL LENGUAJE NATURAL Y LA WEB SEMÁNTICA

    (cód. 62573. Curso fundamental)

    Impartido por:

    • Maximiliano Saiz Noeda
    • Andrés Montoyo Guijarro
    • José Luis Vicedo González
    • Manuel Palomar Sanz
    • German Rigau Claramunt
    • Armando Suárez Cueto

    Programa:

    1. Conceptos y componentes de una ontología aplicados a PLN y web semántica
    2. Recursos ontológicos
    3. Uso de ontologías
      1. Las ontologías y el Procesamiento del Lenguaje Natural
        • Las ontologías en el WSD
        • Las ontologías en la Búsqueda de Respuestas
      2. Las ontologías y la web semántica
    4. Diseño de ontologías
    5. Disertaciones bibliográficas

    Objetivos pedagógicos:

    • Estudio de los conceptos fundamentales sobre las clasificaciones ontológicas y sus componentes
    • Estudio y uso de los recursos ontológicos más relevantes
    • Aplicación de las ontologías en tareas de Procesamiento del Lenguaje Natural y la web semántica
    • Aprendizaje de diseño de ontologías aplicadas al PLN

    Metodología utilizada:

    • Clases magistrales combinadas con seminarios participativos que fomenten la interacción y mejoren el aprendizaje
    • Uso de métodos audiovisuales avanzados

    Criterios de evaluación:

    • La calificación se fundamentará en la evaluación continua que combine la asistencia a clase, la propuesta de trabajos sobre la materia estudiada y las disertaciones bibliográficas

    Bibliografía más relevante recomendada:

    • Eduard Hovy. Using an Ontology to simplify data access. Communications of the ACM 46(1). 2003.
    • Manning, C. D.; Schütze, H. Foundations of Statistical Natural Language Processing. MIT Press. 1999.
    • Miller, G.A.; Beckwidth, R.; Fellbaum, C.; Gross, D.; Miller, K.J. Introduction to WordNet: An On-Line Lexical Database. In "International Journal of Lexicography", Vol. 3, No. 4, pp. 235-244. 1990.
    • Vossen, P. 2000. EuroWordNet: a Multilingual Database withWordNets in 8 languages. The ELRA Newsletter, 5(1):9-10. 2000.
  14. CÓMO SE ESCRIBEN Y SE PUBLICAN TRABAJOS CIENTÍFICOS

    (cód. 61345. Curso metodológico)

    Impartido por:

    • Mikel L. Forcada Zubizarreta
    • Juan Antonio Pérez Ortiz

    Programa:

    • Introducción
    • Ciencia y comunicación
    • La preparación de una comunicación científica escrita
    • La preparación de una comunicación científica oral
    • La búsqueda en bases de datos de publicaciones
    • Preparación de documentos y presentaciones con LaTeX
    • Derechos de autor y de explotación

    Objetivos pedagógicos:

    • Comprender la necesidad de métodos especializados de documentación y comunicación para el trabajo científico y tecnológico;
    • Ser consciente del papel crucial de los métodos de comunicación y documentación en el avance de la ciencia y la técnica;
    • Conocer y asumir en el trabajo personal los mecanismos básicos de producción de documentos de naturaleza científica;
    • Conocer los mecanismos de publicación de trabajos científicos;
    • Aprender a preparar y realizar presentaciones orales de trabajos científicos;
    • Aprender a realizar y defender pósters de trabajos científicos
    • Conozca los mecanismos básicos de obtención de documentos científicos e información en torno a ellos, con énfasis en los recursos actuales de la Universidad de Alicante;
    • Conozca los aspectos reltivos a los derechos de autor y de explotación de los trabajos publicados
    • Se plantee estrategias posibles de organización de la documentación científica, y las adapte a su trabajo como investigador.

    Metodología utilizada:

    • El trabajo en clase se estructura en torno a un programa de actividades que sirve para ir introduciendo los conceptos y técnicas centrales del curso. Las actividades se realizan, primero individualmente y después en grupos pequeños (fijos, de tres personas) y los resultados parciales de cada grupo se ponen después en común en el grupo grande (toda el aula).
    • Las sesiones de actividades serán complementadas con sesiones técnicas en el aula (en las que se profundizará en aspectos técnicos de la asignatura) y con sesiones prácticas en el laboratorio.

    Criterios de evaluación:

    • Para superar el curso será necesario asistir regularmente a las sesiones de trabajo e involucrarse activamente en su desarrollo. No está previsto el seguimiento no presencial del curso. La participación de cada estudiante en las actividades influirá en su calificación. Para ello, el profesorado evaluará continuamente el trabajo de cada estudiante. Para obtener calificaciones altas es necesaria la realización de un trabajo adicional fuera de las horas de aula.

    Bibliografía más relevante recomendada:

    • Day, R.A. (1994) "How to Write and Publish a Scientific Paper", Oryx.
    • Kopka, Helmut; Daly, Patrick W. (2003) "Guide to LaTeX". Pearson Education.
    • Martínez de Sousa, José (1992) "Diccionario de tipografía y del libro" (tercera edición). Paraninfo.
    • The University of Chicago Press (1993) "The Chicago Manual of Style". Chicago: The University of Chicago Press
    • Otros materiales electrónicos disponibles en http://www.dlsi.ua.es/~mlf/ceptc/

PERÍODO DE INVESTIGACIÓN

(22 cursos de 12 créditos cada uno)
  1. TRABAJO DE MÚSICA POR COMPUTADOR

    (cód. 62570)
    • José Manuel Iñesta Quereda
    • Francisco Moreno Seco

    Programa:

    • Trabajo de investigación tutelado

    Objetivos pedagógicos:

    • Realizar un trabajo sobre alguno de los temas de investigación sobre los que trabaja el grupo de trabajo en música por computador.

    Metodología utilizada:

    • El curso se lleva a cabo mediante el trabajo del alumno dirigido y supervisado por el responsable del curso.

    Criterios de evaluación:

    • Al final del mismo, el alumno deberá presentar una memoria donde se describa el trabajo realizado y los resultados y conclusiones obtenidas. Para la calificación final se valorará especialmente que el alumno haya sido capaz de realizar una publicación científica sobre su trabajo en un congreso o revista.

    Bibliografía más relevante recomendada:

    • Roads, C. "The Computer Music Tutorial". MIT Press, 1996
    • Boulanger, R. "The CSound Book". MIT Press, 2000.
    • Schwanauer, M and Levitt, D.A. "Machine Models of Music". MIT Press, 1993.
    • Griffith, N. And Todd, P.M. "Musical Networks". MIT Press 1999.
    • P.J. Ponce de León, J.M. Iñesta. "Feature-driven recognition of music styles" . In: Lecture Notes in Computer Science, 2652; pp. 773-781. Springer-Verlag, 2003.
    • D. Rizo, J.M. Iñesta, F. Moreno-Seco. "Tree-structured representation of musical information". In: Lecture Notes in Computer Science, 2652; pp. 838-846. Springer-Verlag, 2003.
  2. TÈCNIQUES D'ESTATS FINITS EN TRADUCCIÓ AUTOMÀTICA

    (cód 60456)
    • Mikel L. Forcada Zubizaterra
    • Rafael Carlos Carrasco Jiménez
    • Juan Antonio Pérez Ortiz

    Programa:

    • Técnicas de estados finitos en traducción automática: procesamiento léxico, desambiguación léxica, análisis sintáctico superficial; procesamiento LRLM (left-to-right, longest-match). Sistemas de traducción automática completamente basados en estados finitos.
    • Transductores de estados finitos: transductores de letras, transductores p-subsecuenciales; transductores deterministas e indeterministas; composición, minimización, determinización.
    • Construcción de transductores de estados finitos a partir de diccionarios morfológicos y bilingües para el procesamiento léxico
    • Implementación como transductores de estados finitos de desambiguadores léxicos entrenados sobre corpus
    • Implementación de módulos de transferencia estructural basados en transductores de estados finitos
    • Memorias de traducción basadas en transductores de estados finitos
    • Implementación eficiente de transductores de estados finitos.

    Objetivos pedagógicos:

    • Investigar la implementación de módulos reales (o sistemas reales completos) de traducción automática en términos de transductores de estados finitos.

    Metodología utilizada:

    • Investigación tutelada, básicamente orientada a la suficiencia investigadora: especificación, implementación, evaluación y documentación de uno o más módulos de estados finitos de un sistema real de traducción automática

    Criterios de evaluación:

    • Presentación por escrito de un informe (en formato de trabajo científico) que describa la investigación tutelada realizada y presentación oral (en forma de charla en un congreso) de este mismo trabajo. La evaluación considerará ambas presentaciones y será evaluada por los profesores de la asignatura.

    Bibliografía más relevante recomendada:

    • Kornai, A., ed. (1999) Extended Finite State Models of Language. Cambridge University Press.
    • Roche, E. & Schabes, Y., eds. (1997) Finite-State Language Processing. MIT Press, Massachusetts.
  3. XARXES NEURALS RECURRENTS I RECURSIVES

    (cód. 60460)
    • Juan Antonio Pérez Ortiz

    Programa:

    • Las redes neurales recurrentes de tiempo discreto y las redes neurales recursivas (y los algoritmos de entrenamiento específicos desarrollados para ellas) constituyen una de las posibles soluciones cuando las tareas comportan el procesamiento adaptativo de secuencias de datos o de estructuras más complejas de los mismos como árboles o grafos dirigidos acíclicos. Este tipos de redes son capaces de descubrir (si se las entrena adecuadamente) regularidades temporales en las secuencias procesadas. El trabajo de investigación tutelada versará sobre alguna aplicación de estas técnicas, especialmente en el área del procesamiento del lenguaje natural, en la que trabajan un gran número de investigadores del Departamento.

    Objetivos pedagógicos:

    • Conocer los principales modelos de redes neuronales recurrentes y recursivas.
    • Aplicar estas redes a tareas de predicción y clasificación de secuencias y de otras estructuras, como por ejemplo árboles.
    • Evaluar los resultados considerando los de otros modelos alternativos.

    Metodología utilizada:

    • El proceso de aprendizaje se realizará mediante un proceso tutorial personalizado.

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Kolen, J. F. y S. C. Kremer, coordinadores (2001). "A field guide to dynamical recurrent networks", IEEE Press.
    • Haykin, S. (1999). "Neural networks: a comprehensive foundation", Prentice- Hall, New Jersey, 2.a ed.
    • Haykin, S., coordinador (2001). "Kalman filtering and neural networks", Wiley
  4. CLASIFICACIÓN DE DOCUMENTOS ELECTRÓNICOS BASADA EN TECNICAS PROCESAMIENTO DEL LENGUAJE NATURAL

    (cód. 60641)
    • Manuel Palomar Sanz
    • José Luis Vicedo González

    Programa:

    • Cada vez más, las organizaciones e instituciones requieren más tiempo para clasificar documentos, informes, mensajes de publicidad, etc. en sus diferentes departamentos. Por todo ello, se pretende estudiar y desarrollar técnicas basadas en el Procesamiento del Lenguaje Natural capaces de clasificar automáticamente documentos según diferentes temas. Para ello, se estudiarán tanto técnicas basadas en el conocimiento como técnicas basadas en corpus o estadísticas.

    Objetivos pedagógicos:

    • Estudiar técnicas de PLN aplicadas a la clasificación de documentos
    • Construir sistemas de clasificación de documentos
    • Evaluar resultados frente a otros sistemas similares

    Metodología utilizada:

    • Clases magistrales combinadas con seminarios participativos que fomenten la interacción y mejoren el aprendizaje
    • Uso de métodos audiovisuales avanzados

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Introducción al Procesamiento del lenguaje Natural. L. Moreno, M. Palomar, A. Molina, A.Ferrández. Servicio de publicaciones de la Universidad de Alicante. 1999
    • Tecnologías del Lenguaje. Martí, M.A. Et al. Editorial UOC. 2003
    • The Oxford Handbook of Computational Linguistics. Oxford University Press. 2003
  5. OBTENCIÓN DE RESÚMENES DE DOCUMENTOS BASADA EN CADENAS DE REFERENCIA

    (cód. 60462)
    • Manuel Palomar Sanz

    Programa:

    • Se pretende desarrollar técnicas de obtención de resúmenes de textos que toman como entrada documentos completos. Para ello, nos basaremos en técnicas de resolución de la correferencia lingüística, es decir, se pretende obtener las cadenas de correferencia lingüística existentes en el texto y en base a estas cadenas construir un método capaz de obtener resúmenes de textos.|

    Objetivos pedagógicos:

    • Estudiar técnicas de PLN aplicadas a resúmenes de documentos
    • Construir sistemas de resúmenes de documentos
    • Evaluar resultados frente a otros sistemas similares

    Metodología utilizada:

    • Clases magistrales combinadas con seminarios participativos que fomenten la interacción y mejoren el aprendizaje
    • Uso de métodos audiovisuales avanzados

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Introducción al Procesamiento del lenguaje Natural. L. Moreno, M. Palomar, A. Molina, A.Ferrández. Servicio de publicaciones de la Universidad de Alicante. 1999
    • Tecnologías del Lenguaje. Martí, M.A. Et al. Editorial UOC. 2003
    • The Oxford Handbook of Computational Linguistics. Oxford University Press. 2003
  6. RECUPERACIÓN DE INFORMACIÓN DE SEDES WEB

    (cód. 60463)
    • Antonio Ferrández Rodriguez

    Programa:

    • La popularización del uso de Internet ha posibilitado la existencia de enormes cantidades de información y la ha puesto al alcance de cualquier usuario de este medio. Sin embargo, la localización de toda la información realmente relevante acerca de un tema concreto sigue siendo una labor lenta y tediosa. La aparición de los buscadores (sistemas que intentan localizar los documentos que en un momento dado son de nuestro interés) ha facilitado dicha tarea; sin embargo, los resultados hasta la fecha no son lo suficientemente satisfactorios y sólo facilitan en pocos aspectos la búsqueda de la información. Es por ello que se pretende construir un sistema de recuperación de información (SRI) de sedes Web. Como recuperación de información (RI) se entiende la capacidad de seleccionar de entre una gran cantidad de documentos aquellos cuyo contenido hace referencia a un tema indicado.

    Objetivos pedagógicos:

    • Construir un sistema de recuperación de información de sedes Web.
    • Evaluar dicho sistema en función de su precisión y cobertura.
    • Comparar dicho sistema con otros existentes en la literatura existente.

    Metodología utilizada:

    • Tutorización del alumno y realización del prototipo del sistema de recuperación de información en los laboratorios del departamento.

    Criterios de evaluación:

    • La calificación final se basará en el sistema presentado por el alumno.

    Bibliografía más relevante recomendada:

    • Modern Information Retrieval. Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley. 1999.
    • Introduction to modern information retrieval. G. G. Chowdhury. Library Association Publishing London. 1999.
    • Curso de la UNED: IR & NLP Course
    • INFORMATION RETRIEVAL BOOK. C. J. van RIJSBERGE.
  7. TRABAJO SOBRE EXTRACCIÓN DE INFORMACIÓN E INSERCIÓN EN BASES DE DATOS

    (cód. 60464)
    • Manuel Palomar Sanz
    • Antonio Ferrández Rodríguez

    Programa:

    • Se pretende que el alumno construya un sistema de extracción de información (SEI) relevante a partir de textos. Para ello será necesario estudiar los diferentes sistemas de extracción de información existentes así como las diferentes propuestas. Posteriormente y tomando como base un sistema de procesamiento del lenguaje natural orientado a la resolución de la anáfora, se construirá un SEI que lo utilice para resolución de las posibles correferencias lingüísticas.

    Objetivos pedagógicos:

    • Construir un sistema de extracción de información relevante a partir de textos en lenguaje natural.
    • Evaluar dicho sistema en función de su precisión y cobertura.
    • Comparar dicho sistema con otros existentes en la literatura existente.
    • Estudiar el impacto de la aplicación de técnicas de lenguaje natural sobre la precisión del sistema, especialmente aquellas relacionadas con la resolución de correferencias lingüísticas.

    Metodología utilizada:

    • Tutorización del alumno y realización del prototipo del sistema de extracción de información en los laboratorios del departamento

    Criterios de evaluación:

    • La calificación final se basará en el sistema presentado por el alumno.

    Bibliografía más relevante recomendada:

    • Moreno, L.; Palomar, M.; Molina, A.; Ferrández, A. Introducción al procesamiento del lenguaje natural. Editado por el servicio de publicaciones de la Universidad de Alicante. 1999.
    • Modern Information Retrieval. Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley. 1999.
    • Introduction to modern information retrieval. G. G. Chowdhury. Library Association Publishing London. 1999.
  8. CONSTRUCCIÓN DE UN INTERFAZ EN LENGUAJE NATURAL PARA EL ACCESO A BASES DE DATOS

    (cód. 60465)
    • Antonio Ferrández Rodríguez

    Programa:

    • Estudio y desarrollo de una interfaz en lenguaje natural para el acceso (definición y manipulación) a los datos de una base de datos (BD). Para ello, en primer lugar, se estudiarán los recursos existentes en el mercado así como los disponibles en el grupo de investigación que puedan formar parte de esta interfaz. En segundo lugar, se contruirá el sistema de procesamiento del lenguaje natural; este sistema tomará como entrada una frase en lenguaje natural y la traducirá a un lenguaje formal (en este caso a una sentencia SQL). La salida del sistema (SQL) accederá a la BD, la cual devolverá una respuesta. Se mostrará la respuesta de la BD, no será necesario generar la respuesta en lenguaje natural.

    Objetivos pedagógicos:

    • Construir un interfaz en lenguaje natural para el acceso (definición y manipulación) a los datos de una base de datos.
    • Evaluar dicho sistema en función de su precisión y cobertura.
    • Comparar dicho sistema con otros existentes en la literatura existente.
    • Estudiar el impacto de la aplicación de técnicas de lenguaje natural sobre la precisión del sistema.

    Metodología utilizada:

    • Tutorización del alumno y realización del prototipo del sistema de extracción de información en los laboratorios del departamento

    Criterios de evaluación:

    • La calificación final se basará en el sistema presentado por el alumno.

    Bibliografía más relevante recomendada:

    • Moreno, L.; Palomar, M.; Molina, A.; Ferrández, A. Introducción al procesamiento del lenguaje natural. Editado por el servicio de publicaciones de la Universidad de Alicante. 1999.
    • Modern Information Retrieval. Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley. 1999.
    • Introduction to modern information retrieval. G. G. Chowdhury. Library Association Publishing London. 1999.
  9. CONSTRUCCIÓN Y PERSONALIZACIÓN DE UN SERVIDOR DE APLICACIONES PARA COMERCIO ELECTRÓNICO

    (cód. 61347)
    • Jaime Gómez Ortega

    Programa:

    • El comercio electrónico consiste en la compra y venta de productos o de servicios a través de medios electrónicos, tales como el Internet y otras redes de computadoras. La cantidad de comercio llevada a cabo electrónicamente ha crecido extraordinariamente debido a la propagación del Internet. Una gran variedad de comercio se realiza de esta manera, estimulando la creación y utilización de innovaciones como la transferencia de fondos electrónica, la administración de cadenas de suministro, el marketing en Internet, el procesamiento de transacciones en línea (OLTP), el intercambio electrónico de datos (EDI), los sistemas de administración del inventario, y los sistemas automatizados de recolección de datos. Este trabajo consistirá en utilizar técnicas de modelado conceptual de aplicaciones web para diseñar e implementar un sistema estándar de comercio electrónico con funcionalidades básicas.

    Objetivos pedagógicos:

    • Aplicar técnicas avanzadas de producción de software a un dominio concreto como lo es el comercio electrónico.
    • Conocer las bases necesarias para construir software escalable en entornos web y a cómo mantener su integridad y seguridad.
    • Introducir las características principales en el uso y configuración de servidores de aplicaciones.

    Metodología utilizada:

    • El curso se lleva a cabo mediante el trabajo del alumno dirigido y supervisado por el responsable del curso.

    Criterios de evaluación:

    • La evaluación consistirá en la documentación y presentación por parte del candidato del trabajo ante una audiencia por espacio de 30 minutos.

    Bibliografía más relevante recomendada:

    • Executable UML: A Foundation for Model Driven Architecture. Stephen Mellor, Marc Balcer. Addison-Wesley, 2003.
    • The Object Constraint Language: Getting Your Models Ready for MDA, Second Edition. Jos Warmer, Anneke Kleppe. Addison-Wesley, 2003.
    • Building Web Applications with UML (2nd Edition). Jim Conallen. Addision-Wesley, 2002.
    • Introduction to E-Commerce. Jeffrey F. Rayport, Bernard J. Jaworski. Mc Graw-Hill, 2002.
  10. HERRAMIENTAS PARA GENERAR INTERFACES CLIENTE DE APLICACIONES WEB INDEPENDIENTES DEL DISPOSITIVO(PC' S, WAP,WEBTV, PDA'S)

    (cód. 61348)
    • Jaime Gómez Ortega

    Programa

    • La Independencia de Dispositivo está basada principalmente en la idea de que independientemente del dispositivo o dispositivos usados para acceder a la información, ésta va a estar siempre disponible y accesible para el usuario, es decir, se trata de hacer la Web universal y accesible para cualquier persona, en cualquier sitio, en cualquier momento y usando cualquier dispositivo, evitando la fragmentación de la Web en espacios accesibles sólo por dispositivos concretos. El objetivo principal es mejorar la experiencia del usuario y al mismo tiempo reducir costes al desarrollar estándares que permitan acceder a esa información desde cualquier dispositivo. En este trabajo se aplicarán técnicas RIA web para diseñar e implementar interfaces de usuario flexibles e intuitivos según el tipo de dispositivo desde el que se esté accediendo.

    Objetivos pedagógicos:

    • Aprender a diseñar interfaces de usuario independiente de dispositivo que conecten de forma precisa con módulos de lógica preexistentes.
    • Producir interfaces de usuario para dispositivos móviles.
    • Especificar prototipos de navegación en espacios hetereogéneos de información.

    Metodología utilizada:

    • El curso se lleva a cabo mediante el trabajo del alumno dirigido y supervisado por el responsable del curso.

    Criterios de evaluación:

    • La evaluación consistirá en la documentación y presentación por parte del candidato del trabajo ante una audiencia por espacio de 30 minutos.

    Bibliografía más relevante recomendada:

    • Executable UML: A Foundation for Model Driven Architecture. Stephen Mellor, Marc Balcer. Addison-Wesley, 2003.
    • The Object Constraint Language: Getting Your Models Ready for MDA, Second Edition. Jos Warmer, Anneke Kleppe. Addison-Wesley, 2003.
    • Building Web Applications with UML (2nd Edition). Jim Conallen. Addision-Wesley, 2002.
    • The Essential Guide to User Interface Design. Wilbert O. Galitz. Addision-Wesley, 2003.
  11. TRABAJO SOBRE TÉCNICAS DE RECONOCIMIENTO DE FORMAS

    (cód. 61725)
    • María Luisa Micó Andrés
    • Juan Ramón Rico Juan

    Programa:

    • Estudio y desarrollo de técnicas avanzadas de reconocimiento de formas con aplicación a problemas reales. Uso de algoritmos desarrollados y estudiados en el curso de doctorado "Estudio y aplicación de técnicas avanzadas de reconocimiento de formas".

    Objetivos pedagógicos:

    • Estudio e implementación de un tema de investigación abierto, comparativa con otros métodos relacionados.

    Metodología utilizada:

    • El proceso de aprendizaje se realizará mediante un proceso tutorial personalizado.

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Pattern Clasification, 2nd edition Richard O. Duda, Peter E. Hart, David G. Stork. John Wiley & Sons, 2000.
    • Syntactic Pattern Recognition, an Introduction Rafael C. Gonzalez, Michael G. Thomason. Addison-Wesley Publishing Company, 1978.
  12. ASPECTES LINGÜÍSTICS DEL DISSENY DE SISTEMES DE TRADUCCIÓ AUTOMÀTICA

    (cód. 62028)
    • Mikel L. Forcada Zubizarreta

    Programa:

    • La construcción composicional de las traducciones: el principio de composicionalidad semántica.
    • La traducción automática como el resultado de aproximaciones lingüísticas a la traducción composicional.

    Objetivos pedagógicos:

    • Adquirir los conocimientos básicos sobre lingüística de la traducción en el marco composicional: representaciones morfológicas, sintácticas y semánticas.
    • Ser capaz de formular las estrategias de traducción automática en términos lingüísticos, como aproximaciones a una construcción ideal de las traducciones.
    • Ser consciente de la necesidad de una elicitación completa de las estrategias de éxito en traducción para su implementación en sistemas reales.
    • Explorar posibles soluciones a problemas de la traducción automática basadas radicalmente en principios lingüísticos.

    Metodología utilizada:

    • Investigación tutelada, básicamente orientada a la suficiencia investigadora: estudio de un aspecto lingüístico concreto de una arquitectura concreta de traducción automática.

    Criterios de evaluación:

    • Presentación por escrito de un informe (en formato de trabajo científico) que describa la investigación tutelada realizada y presentación oral (en forma de charla en un congreso) de este mismo trabajo. La evaluación considerará ambas presentaciones y será evaluada por los profesores de la asignatura.

    Bibliografía más relevante recomendada:

    • George Foster, Simona Gandrabur, Philippe Langlais, Pierre Plamondon, Graham Russell and Michel Simard (2003) "Statistical Translation alignment with Compositionnality Constraints" in Proceedings of MT Summit 2003, New Orleans, Louisiana, Sept 24-26, pp.110-117
    • Gambdck, B., Alshawi, H., Carter, D., & Rayner, M. 1991. Measuring compositionality in transfer-based machine translation systems. In J. G. Neal & S. M. Walter (eds.) Proceedings of the 1991 Natural Language Processing Systems Evaluation Workshop.
    • Gertjan van Noord, Joke Dorrepaal, Doug Arnold, Steven Krauwer, Louisa Sadler and Louis des Tombe, An approach to sentence-level anaphora in Machine Translation. EACL 1989 (Manchester)
    • Gertjan van Noord, Reversible Unification Based Machine Translation. Coling 1990, (Helsinki)
    • Isabelle Tellier: Meaning Helps Learning Syntax. ICGI 1998: 25-36
  13. GENERACIÓN AUTOMÁTICA DE CÓDIGO PARA PROCESOS ETL A PARTIR DE UNA EXTENSION DE UML

    (cód. 62099)
    • Juan Carlos Trujillo Mondejar

    Programa:

    • En una arquitectura de almacenes de datos, los procesos ETL (Extracting, Transforming and Loading) son los encargados de extraer de las fuentes de datos operacionales los datos que contendrá el repositorio del almacén de datos. Una vez extraídos los datos, estos procesos ETL realizan las transformaciones necesarias cargándolos posteriormente en el almacén de datos.

      En la actualidad, el diseño y mantenimiento de estos procesos es un aspecto crítico en la configuración de una arquitectura de almacenes de datos. En la práctica, estos procesos ETL se programan en el lenguaje 4GL de la plataforma destino donde se implantará el almacén de datos. De esta forma, la única documentación existente para su gestión y mantenimiento son el código de estos procesos en si. Una consecuencia inmediata de esta forma de proceder es que la detección de errores en la carga de datos (muy comunes en los almacenes de datos) es muy compleja. En nuestro grupo de investigación hemos estado trabajando en la propuesta de una aproximación de modelado conceptual basada en UML para especificar estos procesos ETL. De esta forma, desde la primera fase de diseño se dispone de una aproximación formal que facilita el diseño, configuración y mantenimiento de estos procesos.

      El objetivo del trabajo es extender esta propuesta de modelado de procesos ETL basada en UML para que genere el código necesario dependiendo de la plataforma destino donde se implante el almacén de datos. Para ello, se definirán unos patrones de modelado conceptual donde quede especificado la correspondencia exacta entre los constructores de modelado conceptual y su correspondiente representación en el lenguaje 4GL correspondiente.

    Objetivos pedagógicos:

    • Realizar una extensión de UML que permita especificar procesos ETL
    • Generar el código necesario, a partir de la extensión anterior de UML, para ejecutar los procesos ETL en una plataforma comercial

    Metodología utilizada:

    • El curso se lleva a cabo mediante el trabajo del alumno dirigido y supervisado por el responsable del curso.

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • The Data Warehouse Toolkit R. Kimball. Ed. John-Wiley, 2002 (ed. 3ª)
    • Building Data Warehouses. W. Inmon. Ed. John-Wiley, 2002 (ed. 3ª)
    • Ralph Kimball Associates and R. Kimball University. R. Kimball. http://www.ralphkimball.com/
    • Inmon.com LLC. W. Inmon. http://www.billinmon.com/
    • OLAP Council. http://www.olapcouncil.org/
    • The Data Warehouse Institute. http://www.dw-institute.com/
    • Oracle Warehouse Builder and Oracle OLAP. http://www.oracle.com/
    • Juan Trujillo, Sergio Luján-Mora. A UML Based Approach for Modeling ETL Processes in Data Warehouses. 22nd International Conference on Conceptual Modeling (ER 2003), p. 307-320: Lecture Notes in Computer Science 2813, Chicago (USA), October 13-16 2003.
    • Juan Trujillo, Manuel Palomar, Jaime Gómez, Il-Yeol Song. Designing Data Warehouses with OO Conceptual Models. IEEE Computer, Special issue on Data Warehouses, Vol. 34 (Diciembre), number 12. pp. 66 - 75. ISSN: 0018-9162.
    • Sergio Luján-Mora, Juan Trujillo. A Comprehensive Method for Data Warehouse Design. 5th International Workshop on Design and Management of Data Warehouses (DMDW'03), p. 1.1-1.14, Berlin (Germany), September 8 2003.
    • Sergio Luján-Mora, Juan Trujillo, Il-Yeol Song. Extending UML for Multidimensional Modeling. 5th International Conference on the Unified Modeling Language (UML 2002), p. 290-304: Lecture Notes in Computer Science 2460, Dresden (Germany), September 30 - October 4 2002.
    • Esperanza Marcos, Belén Vela, José María Cavero: Extending UML for Object-Relational Database Design. UML 2001: 225-239
  14. HERRAMIENTAS PARA MEDICIÓN DE CALIDAD EN APLICACIONES WEB

    (cód. 62567)
    • Cristina Cachero Castro

    Programa:

    • El trabajo profundizará en los conceptos presentados en el curso 'Calidad en el Diseño de Aplicaciones Web'. Para ello, se implementarán varias versiones de una aplicación en función de las métricas que quieran ser validadas. Dichas versiones deberán llevar embebida la lógica necesaria para capturar tiempos de acceso. El objetivo es la validación empírica de en qué medida cada factor de los evaluados influye en la apreciación externa de 'calidad' por parte del usuario.

    Objetivos pedagógicos:

    • Familiarizar al alumno con las principales métricas de calidad en Web.
    • Introducir al alumno en el campo del Software Empírico, y proporcionarle las herramientas y principios sobre los cuales el alumno pueda desarrollar y validar sus propias métricas
    • Desarrollar la destreza del alumno en la aplicación de los conocimientos teóricos adquiridos a casos prácticos.

    Metodología utilizada:

    • El trabajo se desarrollará en base a tutorías periódicas donde el profesor realice un seguimiento continuo del trabajo del alumno.

    Criterios de evaluación:

    • La evaluación de este curso se basa en un trabajo de investigación tutelado. Su defensa se llevará a cabo delante de un tribunal y conducirá a la obtención del título de Suficiencia Investigadora.

    Bibliografía más relevante recomendada:

    • Fenton, N. y Pfleeger, S. L. (1997). Software Metrics: A Rigorous Approach 2nd. edition. London. Chapman & Hall.
    • Genero M., Piattini M. y Calero C. (eds.). Metrics for Software Conceptual Models. (2004). Imperial College Press, Londres.
    • Juristo N. and Moreno A.Mª. (2001) Basics of Software Engineering Experimentation, Kluwer Academic Publishers.
    • Kan. S. Metrics and Models in Software Quality Engineering. EEUU, Addison-Wesley.
    • Piattini M., Calero C. y Genero M. (eds.) (2002). Information and database quality. Kluwer Academic Publishers, Norwell, EEUU.
    • Wohlin C., Runeson P., Höst M., Ohlson M., Regnell B. y Wesslén A. (2000) Experimentation in Software Engineering: An Introduction, Kluwer Academic Publishers.
  15. CONSTRUCCIÓN DE ONTOLOGÍAS PARA EL PROCESAMIENTO DEL LENGUAJE NATURAL Y LA WEB SEMÁNTICA

    (cód. 62574)
    • Maximiliano Saiz Noeda
    • Andrés Montoyo Guijarro
    • Armando Suárez Cueto

    Programa:

    • Uso de ontologías para simplificar el acceso a la información
    • Creación automática de ontologías de dominio a partir de ontologías genéricas
    • Construcción de ontologías a partir de recursos multilingües
    • Extracción de conocimiento ontológico de dominios concretos a partir de la web

    Objetivos pedagógicos:

    • Los objetivos de este trabajo de investigación es el de profundizar en el estudio y uso de las ontologías y su aplicación a tareas de Procesamiento del Lenguaje Natural y la web semántica

    Metodología utilizada:

    • El proceso de aprendizaje se realizará mediante un proceso tutorial personalizado.

    Criterios de evaluación:

    • Evaluación de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Eduard Hovy . Using an Ontology to simplify data access. Communications of the ACM 46(1). 2003.
    • Manning, C. D.; Schütze, H. Foundations of Statistical Natural Language Processing. MIT Press. 1999.
    • Miller, G.A.; Beckwidth, R.; Fellbaum, C.; Gross, D.; Miller, K.J. Introduction to WordNet: An On-Line Lexical Database. In "International Journal of Lexicography", Vol. 3, No. 4, pp. 235-244. 1990.
    • Vossen, P. 2000. EuroWordNet: a Multilingual Database withWordNets in 8 languages. The ELRA Newsletter, 5(1):9-10. 2000.
  16. LABORATORIO DE EXTRACCIÓN DE INFORMACIÓN TEXTUAL

    (cód. 62575)
    • Rafael Muñoz Guillena
    • Patricio Martínez Barco
    • Armando Suárez Cueto

    Programa:

    • Descripción de las arquitecturas más comunes de los sistemas de extracción de información textual
    • Desarrollo de recursos independientes del tipo de información a extraer
    • Desarrollo de recursos dependientes del tipo de información a extraer
    • Utilización de ontologías de dominio
    • Desarrollo de un sistema de extracción de información sobre un dominio específico

    Objetivos pedagógicos:

    • El objetivo de este trabajo es conocer de forma más detallada las dificultades que presentan los sistemas de extracción de información dado que son dependientes del tipo de información que se considere relevante.
    • Complementar los conocimientos adquiridos en el curso de Extracción de Información Textual

    Metodología utilizada:

    • El proceso de aprendizaje se realizará mediante la tutorización del alumno planificada en periodos de tiempo

    Criterios de evaluación:

    • Valoración de un trabajo teórico-práctico

    Bibliografía más relevante recomendada:

    • Information Extraction. J. Cowie and W. Lehnert. Communications of ACM 1996
    • Information Extraction: Technique and Challenges. R. Grishman. In Maria Teresa Pazienzia (Ed.). LNCS, 1299:10-27. Springer-Verlag 1997
    • Introduction to Information Extraction technology. D.E. Appelt and D.J. Israel. Tutorial for IJCAI 1999
    • Information Extraction as a core language technology. What is IE?. Y. Wilks. In Maria Teresa Pazienzia (Ed.). LNCS, 1299:10-27. Springer-Verlag 1997
    • Customization of Information Extraction Systems. R. Yangarber and R. Grishman. In Maria Teresa Pazienzia (Ed.). LNCS, 1299:10-27. Springer-Verlag 1997
  17. INTERFACES DE LENGUAJE NATURAL

    (cód. 62576)
    • Patricio Martínez Barco
    • Rafael Muñoz Guillena

    Programa:

    • Creación de herramientas para el reconocimiento de lenguaje natural
    • Creación de herramientas para la generación del lenguaje.
    • Desarrollo de sistemas de diálogo.

    Objetivos pedagógicos:

    • Profundizar en el estudio y uso de los interfaces basados en lenguaje natural y su aplicación.

    Metodología utilizada:

    • El proceso de transmisión y adquisición de conocimientos se basa en un proceso tutorial personalizado entre alumno y profesor.

    Criterios de evaluación:

    • La evaluación del trabajo estará fundamentada en la funcionalidad e implementación del sistema objeto, así como en la realización de la memoria descriptiva del trabajo investigador realizado por el alumno.

    Bibliografía más relevante recomendada:

    • Jurafsky, D. and Martin, J.H. Speech and Language Processing. Prentice-Hall. 2000.
    • Allen, J. Natural Language Understanding. Benjamin Cummings. 1994.
    • Allen, J., Byron, D., Dzikovska, M., Ferguson, G., Galescu, L. and Stent, A., Towards a Generic Dialogue Shell, Natural Language Engineering,6(3) 2000. pp1-16
  18. DESARROLLO DE SISTEMAS DE BÚSQUEDA DE RESPUESTAS

    (cód. 62577)
    • José Luis Vicedo González

    Programa:

    1. Introducción.
    2. ¿Qué es un sistema de búsqueda de respuestas?
    3. Contexto histórico. Áreas relacionadas
    4. Aplicaciones
    5. Sistemas de búsqueda de respuestas
    6. Arquitectura general de los sistemas
      1. El análisis de la pregunta
      2. La recuperación de documentos
      3. La extracción de la respuesta
    7. Taxonomia de los sistemas de búsqueda de respuestas
      1. Clasificaciones
      2. Estudio de las diferentes aproximaciones
    8. Principales líneas de desarrollo

    Objetivos pedagógicos:

    1. Conocer la finalidad de los sistemas de búsqueda de respuestas.
    2. Conocer los módulos que forman los sistemas de búsqueda de respuestas y su funcionamiento.
    3. Conocer las herramientas de PLN, RI y EI aplicables en estos sistemas.
    4. Conocer y comparar las diferentes aproximaciones actualmente existentes.
    5. Conocer foros internacionales dedicados a la evaluación de sistemas de búsqueda de respuestas.
    6. Conocer las principales líneas de desarrollo abiertas en la actualidad.
    7. Estudio y desarrollo e implementación de una propuesta que afronte y resuelva alguno de los problemas actualmente existentes en este campo.

    Metodología utilizada:


    Plan de trabajo
    1. Estudio y análisis de los diferentes sistemas de BR existentes.
    2. Estudio de las herramientas de RI y PLN que emplean.
    3. Análisis de las diferentes problemáticas en este campo:
      1. Detección y estudio de los principales problemas que afectan al desarrollo de este tipo de sistemas.
      2. Realización de propuestas para la resolución de alguno de estos problemas.
      3. Análisis y estudio de viabilidad de las diferentes soluciones propuestas.
      4. Selección y presentación justificada de propuesta final.
    4. Construcción de un sistema de BR que aplique los principios presentados en la propuesta final.
    5. Entrenamiento y adaptación del sistema.
    6. Evaluación del sistema en el ámbito de las sucesivas conferencias CLEF.
    7. Refinamiento y mejora de la aproximación empleada en base a los resultados obtenidos.

    Metodología utilizada:

    • El proceso de aprendizaje se realizará exclusivamente mediante un proceso tutorial personalizado.

    Criterios de evaluación:

    • La evaluación del trabajo desarrollado por el alumno se fundamentará en el correcto funcionamiento del prototipo de sistema implementado y en el trabajo descriptivo que desarrolla el proceso investigador realizado por el alumno.

    Bibliografía más relevante recomendada:

    • Harabagiu, S., Moldovan, D., Pasca, M., Mihalcea, R., Surdeanu, M., Bunescu, R., Girju, R., Rus, V., Morarescu, P., and Lacatusu, F. 2001. Answering complex, list and context questions with LCC's Question-Answering Server. See TREC-10 [2001].
    • Magnini, B., Negri, M., Prevete, R., and Tanev, H. 2002. Mining Knowledge from Repeated Co-Occurrences: DIOGENE at TREC 2002. See TREC-11 [2002].
    • Moldovan, D., Harabagiu, S., Girju, R., Morarescu, P., Lacatusu, F., Novischi, A., Badulescu, A., and Bolohan, O. 2002. LCC Tools for Question Answering. See TREC-11 [2002].
    • Moldovan, D., Pasca, M., Harabagiu, S., and Surdeanu, M. 2003. Performance Issues and Error Analysis in an Open-Domain Question Answering System. ACM Transactions on Information Systems 21, 2 (April), 133-154.
    • SIGIR 2000. Proceedings of the 23th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Question Answering. Athens, Greece.
    • TREC-10 2001. Tenth Text REtrieval Conference. NIST Special Publication, vol. 500-250. National Institute of Standards and Technology, Gaithersburg, USA.
    • TREC-11 2002. Eleventh Text REtrieval Conference. NIST Special Publication, vol. 500-251. National Institute of Standards and Technology, Gaithersburg, USA.
    • TREC-9 2000. Ninth Text REtrieval Conference. NIST Special Publication, vol. 500-249. National Institute of Standards and Technology, Gaithersburg, USA.
    • Vicedo, J. L. 2002. Semqa: A semantic model applied to question answering systems. Ph.D. thesis, Departament of Languages and Information Systems. University of Alicante, Ctra. De San Vicente s/n. 03080 Alicante. España.
    • Vicedo J.L., Ferrández, A., Llopis F. 2002. "University of Alicante at TREC-10". See TREC-11 [2002].
    • Vicedo J.L., Ferrández 2001. A. "A Semantic Approach to Question Answering Systems". See TREC-10 [2001].
  19. BÚSQUEDA DE INFORMACIÓN BASADA EN PASAJES

    (cód. 62578)
    • Fernando Llopis Pascual

    Programa:

    1. Introducción.
    2. Sistemas de Recuperación de Información
    3. Los sistemas de RI basados en pasajes
      1. Modelos basados en el discurso
      2. Modelos semánticos
      3. Modelos de ventana
    4. Arquitectura general de los sistemas basados en pasajes
    5. Aplicaciones de los sistemas basados en pasajes
    6. Principales líneas de desarrollo

    Objetivos pedagógicos:

    • Construir un sistema de recuperación de información basado en pasajes.
    • Evaluar dicho sistema en función de su precisión y cobertura.
    • Comparar dicho sistema con otros existentes en la literatura existente.

    Metodología utilizada:


    Plan de trabajo
    1. Estudio y análisis de los diferentes sistemas de RI existentes.
    2. Estudio y análisis de los diferentes modelos de RI basados en pasajes existentes.
    3. Estudio de los recursos comúnmente utilizados
    4. Construcción de un sistema de RI básico.
    5. Evaluación y refinamiento del sistema
      1. Adaptación del sistema a las colecciones CLEF
      2. Evaluación del sistema en el ámbito de las sucesivas conferencias CLEF.
      3. Refinamiento de la aproximación empleada en base a los resultados obtenidos.

    Metodología utilizada:

    • El proceso de aprendizaje se realizará exclusivamente mediante un proceso tutorial personalizado.

    Criterios de evaluación:

    • La calificación se fundamentará en la evaluación continua que combine la asistencia a clase y la realización de trabajos sobre la materia estudiada

    Bibliografía más relevante recomendada:

    • Strzalkowski, T. (1999). Natural Language Information Retrieval. Kluwer Academic Publishers.
    • Kaszkiel, M.; Zobel, J.; Sacks-Davis, R. (1999). Efficient passage ranking for document databases. ACM Transactions of Information Systems. 17(4), 406-439.
    • Llopis F.; Vicedo, J. L.; Ferrández, A. Using long queries in a passage retrieval system. Lecture Notes in Computer Science, 2313. Pag.185-193. Ed. Springer-Verlag, 2002.
    • Llopis F.; Ferrández, A.; Vicedo, J. L. Using a Passage Retrieval System to Support Question Answering. Lecture Notes in Computer Science , 2329. Pag.61-69. Ed. Springer-Verlag, 2002.
    • Llopis F.; Vicedo, J. L.: IR-n: A Passage Retrieval System at Clef-2001. Lecture Notes in Computer Science, 2406 pp.244-252. Ed. Springer-Verlag, 2001
    • Llopis F.; Vicedo, J. L. ; Ferrández, A.: IR-n: at Clef-2002. Lecture Notes in Computer Science, 2785 pp.291-300. Ed. Springer-Verlag, 2003
  20. RECUPERACIÓN DE INFORMACIÓN MULTILINGÜE

    (cód. 62579)
    • Jesús Peral Cortés
    • Antonio Ferrández Rodríguez

    Programa:

    • Uno de los problemas pendientes de resolver en los buscadores de información existentes en la actualidad es el afrontar el problema de la multilingualidad. Este problema consiste en poder realizar búsquedas de información independientemente del idioma en el que se presente tanto la pregunta del usuario como los documentos sobre los que se realiza la búsqueda. Por ello se pretende en este curso que el alumno estudie el estado del arte de los sistemas que intentan abordar este problema, para a partir de las soluciones existentes aporte su aproximación al problema. Dicha solución se deberá evaluar y comparar con otros sistemas similares.

    Objetivos pedagógicos:

    • Construir un sistema de recuperación de información multilingüe.
    • Evaluar dicho sistema en función de su precisión y cobertura.
    • Comparar dicho sistema con otros existentes en la literatura existente.

    Metodología utilizada:

    • Tutorización del alumno y realización del prototipo del sistema de recuperación de información en los laboratorios del departamento.

    Criterios de evaluación:

    • La calificación final se basará en el sistema presentado por el alumno.

    Bibliografía más relevante recomendada:

    • Modern Information Retrieval. Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley. 1999.
    • Introduction to modern information retrieval. G. G. Chowdhury. Library Association Publishing London. 1999.
    • Curso de la UNED: IR & NLP Course
    • INFORMATION RETRIEVAL BOOK. C. J. van RIJSBERGEN.
  21. TRABAJO SOBRE APRENDIZAJE CON DATOS ESTRUCTURADOS

    (cód. 63039)
    • José Oncina Carratalá
    • Jorge Calera Rubio

    Programa:

    • Trabajo de investigación tutelado.

    Objetivos pedagógicos:

    • Estudio y desarrollo de algoritmos que permitan, a partir de muestras representativas de datos estructurados, la construcción automática de sistemas de descripción de dichos datos (gramáticas, autómatas o, en general sistemas formales) para su utilización en tareas de: corrección sintáctica, compresión, traducción automática, bioinformática, minería de datos, eliminación de ruido, etc.

    Metodología utilizada:

    • El proceso de aprendizaje se realizará mediante la tutorización del alumno planificada en periodos de tiempo

    Criterios de evaluación:

    • La calificación se fundamentará en la evaluación continua que combine la asistencia a clase y la realización de trabajos sobre la materia estudiada

    Bibliografía más relevante recomendada:

    • de la Higuera. A Bibliographical Study of Grammatical Inference Pattern Recognition, 2003, (y artículos citados)
    • Libros de actas de los congresos: ICGI, ALT, COLT.
  22. APLICACIÓN DE LA INTELIGENCIA ARTIFICIAL A LECTURA AUTOMÁTICA Y MARCADO ESTRUCTURAL DE TEXTOS

    (cód. 63040)
    • Rafael Carlos Carrasco Jiménez

    Programa:

    • Se trata de implementar alguna herramienta para alguna de las siguientes tareas:
      • Etiquetado semiautomático de textos.
      • Indexación de estructuras e integración con diccionarios para la búsqueda de información en textos etiquetados. Simplificación y especialización automática de DTD (Document Type Definition).
      • Otras herramientas que permitan aprovechar el marcado estructural, por ejemplo para la recuperación de información.

    Objetivos pedagógicos:

    • Investigar la definición de un lenguaje de marcado de textos.
    • Aplicar el marcado estructural de textos para definir nuevas estrategias de búsqueda, transformación y recuperación de información sobre los mismos.

    Metodología utilizada:

    • El proceso de transmisión y adquisición de conocimientos se basa en un proceso tutorial personalizado entre alumno y profesor.

    Criterios de evaluación:

    • La calificación final se basará en el sistema presentado por el alumno.

    Bibliografía más relevante recomendada:

    • Ron Schmelzer: XML and web services unleashed. SAMS 2002.
    • Neil Bradley: The XML companion. Addison-Wesly 2000.
    • Elliotte R. Harold: XML bible. IDG Books 1999.
Última actualización: 8.09.2010
Departamento de Lenguajes y Sistemas Informáticos | Universidad de Alicante | Apartado de Correos 99 | E-03080 Alicante
Teléfono: 965 90 37 72 | Fax: 965 90 93 26 | secretaria en dlsi.ua.es
DLSI 2006 - wwwadm en dlsi.ua.es
Cumple con las especificaciones XHTML 1.0, CSS2, RSS 2.0.