Título: | Ecosistema para el Descubrimiento de Conocimiento en Lenguaje Natural |
Incorpóralo a tu calendario: |
---|---|---|
Tipo: | Defensa de tesis | |
Por: | Alejandro Piad-Morffis | |
Lugar: | online https://ua1.webex.com/ua1/j.php?MTID=mabbab871e733b1d484f88e76845b783d | |
Día/hora: | 16:00 16/12/2021 | |
Duración aproximada: | 2:30 horas | |
Más información: | https://ua1.webex.com/ua1/j.php?MTID=mabbab871e733b1d484f88e76845b783d | |
Persona de contacto: | Muñoz Guillena, Rafael (rafaeldlsi.ua.es) | |
Resumen: | Esta investigación presenta el diseño y la construcción de un ecosistema para el desarrollo de tecnologías de descubrimiento de conocimiento en el dominiode la salud. Este ecosistema incluye recursos linguísticos, herramientas computacionales y una metodología para la evaluación de nuevos enfoques. Se definió un modelo de anotación para capturar el contenido semántico más relevante de las oraciones en lenguaje natural, basado en una estructura Sujeto-Acción-Objetivo (SVO) y relaciones semánticas adicionales. El modelo no incluye entidades o relaciones de dominio específico para ser lo más general posible. Basado en este modelo, se anotaron manualmente tres corpus con un total de 34; 897 elementos semánticos repartidos en 2; 718 oraciones, tomado como base información en el dominio de salud en idioma español. El corpus permite la construcción de sistemas de descubrimiento de conocimiento que se pueden aplicar en m ultiples dominios. Con este propósito, se organizaron sucesivas campañas de evaluación en las cuáles participaron un total de 24 equipos de investigadores con diferentes estrategias, principalmente enfocadas en arquitecturas de aprendizaje profundo. Para fomentar el desarrollo continuo en esta línea de investigación, se pone a disposición de la comunidad científica una infraestructura y un conjunto de herramientas que incluyen implementaciones básicas con las que compararse, un entorno de evaluación continua en la nube, y estadísticas actualizadas sobre el estado del arte de la tarea eHealth-KD. Adem as se brinda una herramienta para la anotación asistida que permite reducir considerablemente el costo manual de producir nuevos recursos linguísticos en esta area. Estos resultados son parte de una línea de investigación para aprovechar la semántica de propósito general y las tecnologías basadas en el conocimiento junto con las nuevas arquitecturas de aprendizaje profundo en la construcción de tecnologías automáticas de descubrimiento de conocimiento. |
[ Tancar ]