Departamento de Lenguajes y Sistemas Informáticos

Comunicación

Título:Ecosistema para el Descubrimiento de Conocimiento en Lenguaje Natural Incorpóralo a tu calendario:
Tipo:Defensa de tesis
Por:Alejandro Piad-Morffis
Lugar:online https://ua1.webex.com/ua1/j.php?MTID=mabbab871e733b1d484f88e76845b783d
Día/hora:16:00 16/12/2021
Duración aproximada:2:30 horas
Más información:https://ua1.webex.com/ua1/j.php?MTID=mabbab871e733b1d484f88e76845b783d
Persona de contacto:

Muñoz Guillena, Rafael (rafael[Perdone'm]dlsi.ua.es)
Resumen:
Esta investigación presenta el diseño y la construcción de un ecosistema para
el desarrollo de tecnologías de descubrimiento de conocimiento en el dominiode
la salud. Este ecosistema incluye recursos linguísticos, herramientas
computacionales y una metodología para la evaluación de nuevos enfoques.
Se definió un modelo de anotación para capturar el contenido semántico más
relevante de las oraciones en lenguaje natural, basado en una estructura
Sujeto-Acción-Objetivo (SVO) y relaciones semánticas adicionales. El modelo no
incluye entidades o relaciones de dominio específico para ser lo más general
posible. Basado en este modelo, se anotaron manualmente tres corpus con un
total de 34; 897 elementos semánticos repartidos en 2; 718 oraciones, tomado
como base información en el dominio de salud en idioma español. El corpus
permite la construcción de sistemas de descubrimiento de conocimiento que se
pueden aplicar en m ultiples dominios. Con este propósito, se organizaron
sucesivas campañas de evaluación en las cuáles participaron un total de 24
equipos de investigadores con diferentes estrategias, principalmente
enfocadas en arquitecturas de aprendizaje profundo.
Para fomentar el desarrollo continuo en esta línea de investigación, se pone
a disposición de la comunidad científica una infraestructura y un conjunto
de herramientas que incluyen implementaciones básicas con las que compararse,
un entorno de evaluación continua en la nube, y estadísticas actualizadas
sobre el estado del arte de la tarea eHealth-KD. Adem as se
brinda una herramienta para la anotación asistida que permite reducir
considerablemente el costo manual de producir nuevos recursos linguísticos
en esta  area. Estos resultados son parte de una línea de investigación
para aprovechar la semántica de propósito general y las tecnologías basadas en
el conocimiento junto con las nuevas arquitecturas de aprendizaje profundo en
la construcción de tecnologías automáticas de descubrimiento de conocimiento.
[ Tancar ]