Comunicación - Departamento de Lenguajes y Sistemas Informáticos

Título:	Defensa de Tesis Doctoral "Procesamiento automático de la pragmática en español a partir de las intenciones comunicativas"	Incorpóralo a tu calendario:
Tipo:	Defensa Tesis
Por:	María Miro Maestre
Lugar:	Salón Actos del Edificio Germán Bernacer
Día/hora:	17:00 11/06/2025
Más información:	https://cvnet.cpd.ua.es/AgendaUA/V/227486?agenda=31510&idioma=es
Persona de contacto:	Saquete Boró, Estela (steladlsi.ua.es)
Resumen:	El nivel de análisis pragmático del lenguaje está considerado como uno de los más complejos debido, entre otros aspectos, a los matices inferenciales y contextuales que procesamos los humanos para llegar a comprender el significado real de cualquier mensaje. Esta dificultad no pasa desapercibida en la disciplina del Procesamiento del Lenguaje Natural (PLN), ya que desde sus inicios, los investigadores dedicados al procesamiento de cualquier lengua se han topado con diversos obstáculos de naturaleza pragmática a la hora de enseñar a los sistemas de aprendizaje cualquier idioma. De hecho, así como la teoría lingüística sitúa la pragmática en el último nivel de análisis para la comprensión de un mensaje, la teoría en lingüística computacional también pone la noción de pragmática en un segundo plano. Esto no ocurre por falta de interés o de importancia de este nivel a la hora de procesar el lenguaje, sino por las dificultades añadidas que implica el análisis pragmático y la falta de recursos lingüísticos que ayuden a su estudio en diferentes lenguas. Entre ellas, las incursiones que se han hecho en el estudio de la pragmática en español con fines computacionales han ido generalmente dirigidas a la creación de sistemas de diálogo. No obstante, existe una carencia de recursos enfocados en la pragmática del español encuadrados en la comunicación escrita, sobre todo dentro de los géneros textuales englobados en la comunicación mediada por ordenador. El estudio de los diferentes fenómenos pragmáticos en el lenguaje escrito permite comprender con más información contextual las opiniones de los usuarios en el entorno digital cuando expresan y comparten sus pensamientos con el resto de la comunidad. El analizar aspectos pragmáticos de la forma de expresarse de los usuarios en estos entornos puede ser de gran ayuda para que los sistemas creados en el área de PLN sepan reconocer y generar respuestas acordes con la información pragmática detectada en el mensaje original. En este sentido, la propia disciplina de PLN se convierte en una aliada para crear recursos lingüísticos de calidad, rigurosos y adaptados al objetivo de identificar esos patrones lingüísticos de naturaleza pragmática automáticamente. La presente investigación supone, pues, la combinación del conocimiento lingüístico que se tiene actualmente respecto al nivel pragmático del español junto con la aplicación de las últimas técnicas de aprendizaje automático propias del contexto computacional para estudiar uno de los fenómenos lingüísticos que sustentan el nivel pragmático del lenguaje: las intenciones comunicativas. Para ello, partimos de la la premisa de que el análisis de los patrones que ayudan a los humanos a identificar las intenciones comunicativas del español puede ser de gran ayuda para los sistemas de aprendizaje automático a la hora de descubrir información pragmática de cualquier mensaje que ayude a su comprensión, además de a la generación automática de mensajes preservando el componente natural de la lengua. A partir de la investigación aquí realizada, se ofrecen dos recursos lingüísticos enfocados en el análisis de las intenciones comunicativas en español. Por un lado, se diseña una guía de anotación de intenciones comunicativas en dos dimensiones discursivas, estas son, la global (que vendría a ser la intención de un mensaje completo) y la segmental (centrada en la intención de cada uno de los segmentos enunciativos que componen ese mismo mensaje). Con ella, y a partir de estrategias de anotación semiautomática propias del área del PLN, se consigue crear el corpus INTENT-ES. Se trata del primer corpus en español de mensajes procedentes de la red social Twitter (conocida actualmente como ‘X’) anotados con sus intenciones comunicativas tanto globales como segmentales. A partir de estos dos recursos, se procede a la evaluación de los modelos de aprendizaje y generación utilizados ampliamente en el PLN para comprobar hasta qué punto pueden tanto clasificar como generar las intenciones comunicativas dependiendo del objetivo de investigación. De este modo, este trabajo ofrece un análisis exhaustivo para constatar hasta dónde han evolucionado estos modelos a la hora de integrar la información pragmática en su conocimiento interno, así como qué caminos futuros se deben abordar para minimizar los obstáculos relacionados con el estudio de la pragmática en el ámbito computacional. Las aportaciones realizadas a partir de esta investigación suponen un paso adelante en la incorporación de la pragmática en los sistemas de aprendizaje propios de la disciplina de PLN para fomentar la investigación en lingüística computacional desde una perspectiva pragmática. Además, consideramos que los recursos diseñados en el transcurso de este trabajo servirán de gran ayuda para que experimentos futuros cuenten con recursos de base pragmática. Así, conseguiremos aportar más información fundamental a los modelos que les haga mejorar su rendimiento en las diferentes tarea de clasificación o generación que ofrece esta disciplina.

[ Tancar ]