Departamento de Lenguajes y Sistemas Informáticos

Comunicación

Título:Defensa de Tesis Doctoral "Procesamiento automático de la pragmática en español a partir de las intenciones comunicativas" Incorpóralo a tu calendario:
[CSV]
Tipo:Defensa Tesis
Por:María Miro Maestre
Lugar:Salón Actos del Edificio Germán Bernacer
Día/hora:17:00 11/06/2025
Más información:https://cvnet.cpd.ua.es/AgendaUA/V/227486?agenda=31510&idioma=es
Persona de contacto:

Saquete Boró, Estela (stela[Perdone'm]dlsi.ua.es)
Resumen:
El nivel de análisis pragmático del lenguaje está considerado como uno de
los más complejos debido, entre otros aspectos, a los matices inferenciales
y contextuales que procesamos los humanos para llegar a comprender el
significado real de cualquier mensaje. Esta dificultad no pasa desapercibida
en la disciplina del Procesamiento del Lenguaje Natural (PLN), ya que desde
sus inicios, los investigadores dedicados al procesamiento de cualquier
lengua se han topado con diversos obstáculos de naturaleza pragmática a la
hora de enseñar a los sistemas de aprendizaje cualquier idioma.

De hecho, así como la teoría lingüística sitúa la pragmática en el último
nivel de análisis para la comprensión de un mensaje, la teoría en lingüística
computacional también pone la noción de pragmática en un segundo plano. Esto
no ocurre por falta de interés o de importancia de este nivel a la hora
de procesar el lenguaje, sino por las dificultades añadidas que implica
el análisis pragmático y la falta de recursos lingüísticos que ayuden a su
estudio en diferentes lenguas. Entre ellas, las incursiones que se han hecho
en el estudio de la pragmática en español con fines computacionales han ido
generalmente dirigidas a la creación de sistemas de diálogo. No obstante,
existe una carencia de recursos enfocados en la pragmática del español
encuadrados en la comunicación escrita, sobre todo dentro de los géneros
textuales englobados en la comunicación mediada por ordenador.

El estudio de los diferentes fenómenos pragmáticos en el lenguaje escrito
permite comprender con más información contextual las opiniones de los usuarios
en el entorno digital cuando expresan y comparten sus pensamientos con el resto
de la comunidad. El analizar aspectos pragmáticos de la forma de expresarse de
los usuarios en estos entornos puede ser de gran ayuda para que los sistemas
creados en el área de PLN sepan reconocer y generar respuestas acordes con
la información pragmática detectada en el mensaje original. En este sentido,
la propia disciplina de PLN se convierte en una aliada para crear recursos
lingüísticos de calidad, rigurosos y adaptados al objetivo de identificar
esos patrones lingüísticos de naturaleza pragmática automáticamente.

La presente investigación supone, pues, la combinación del conocimiento
lingüístico que se tiene actualmente respecto al nivel pragmático del español
junto con la aplicación de las últimas técnicas de aprendizaje automático
propias del contexto computacional para estudiar uno de los fenómenos
lingüísticos que sustentan el nivel pragmático del lenguaje: las intenciones
comunicativas. Para ello, partimos de la la premisa de que el análisis
de los patrones que ayudan a los humanos a identificar las intenciones
comunicativas del español puede ser de gran ayuda para los sistemas de
aprendizaje automático a la hora de descubrir información pragmática de
cualquier mensaje que ayude a su comprensión, además de a la generación
automática de mensajes preservando el componente natural de la lengua.

A partir de la investigación aquí realizada, se ofrecen dos recursos
lingüísticos enfocados en el análisis de las intenciones comunicativas
en español. Por un lado, se diseña una guía de anotación de intenciones
comunicativas en dos dimensiones discursivas, estas son, la global (que vendría
a ser la intención de un mensaje completo) y la segmental (centrada en la
intención de cada uno de los segmentos enunciativos que componen ese mismo
mensaje). Con ella, y a partir de estrategias de anotación semiautomática
propias del área del PLN, se consigue crear el corpus INTENT-ES. Se trata del
primer corpus en español de mensajes procedentes de la red social Twitter
(conocida actualmente como ‘X’) anotados con sus intenciones comunicativas
tanto globales como segmentales. A partir de estos dos recursos, se procede a
la evaluación de los modelos de aprendizaje y generación utilizados ampliamente
en el PLN para comprobar hasta qué punto pueden tanto clasificar como generar
las intenciones comunicativas dependiendo del objetivo de investigación. De
este modo, este trabajo ofrece un análisis exhaustivo para constatar hasta
dónde han evolucionado estos modelos a la hora de integrar la información
pragmática en su conocimiento interno, así como qué caminos futuros se
deben abordar para minimizar los obstáculos relacionados con el estudio de
la pragmática en el ámbito computacional.

Las aportaciones realizadas a partir de esta investigación suponen un paso
adelante en la incorporación de la pragmática en los sistemas de aprendizaje
propios de la disciplina de PLN para fomentar la investigación en lingüística
computacional desde una perspectiva pragmática. Además, consideramos que
los recursos diseñados en el transcurso de este trabajo servirán de gran ayuda
para que experimentos futuros cuenten con recursos de base pragmática. Así,
conseguiremos aportar más información fundamental a los modelos que les haga
mejorar su rendimiento en las diferentes tarea de clasificación o generación
que ofrece esta disciplina.

[ Tancar ]