Título: | UN ENFOQUE MULTIDIMENSIONAL BASADO EN RDF PARA LA PUBLICACIÓN DE LINKED OPEN DATA |
Incorpóralo a tu calendario: |
---|---|---|
Tipo: | Defensa tesis doctoral | |
Por: | Pilar Escobar Esteban. | |
Lugar: | Sala Google Meet: https://meet.google.com/azn-arek-ztc | |
Día/hora: | 11:00 07/07/2020 | |
Duración aproximada: | 2:30 horas | |
Más información: | https://edua.ua.es/es/secretaria/tesis-doctoral/tesis-en-proceso-de-tramitacion/maria-pilar-escobar-esteban.html | |
Persona de contacto: | Marco Such, Manuel (marcodlsi.ua.es) | |
Resumen: | Cada vez hay disponibles más datos de manera pública en Internet y surgen nuevas bases de conocimiento basadas en conceptos de Linked Open Data (datos abiertos enlazados), como DBPedia, Wikidata, YAGO o Google Knowledge Graph, que cubren un amplio abanico de campos del conocimiento. Además, se incorporan los datos que provienen de diversas fuentes como dispositivos inteligentes o las redes sociales. Sin embargo, que estos datos estén públicos y accesibles no garantiza que sean útiles para los usuarios, no siempre se garantiza que sean confiables ni que puedan ser reutilizados de manera eficiente. Actualmente, siguen existiendo barreras que dificultan la reutilización de los datos, porque los formatos son poco adecuados para el procesamiento automático y publicación de la información, por falta de metadatos descriptivos y de semántica,duplicidades, ambigüedad o incluso errores en los propios datos. A todos estos problemas hay que añadir la complejidad del proceso de explotación de la información de un repositorio de datos abiertos enlazados. El trabajo y conocimientos técnicos que requiere el acceso, recolección, normalización y preparación de los datos para que puedan ser reutilizados supone una carga extra para los usuarios y organizaciones que quieran utilizarlos. Para garantizar una eficiente explotación de los mismos, resulta fundamental dotarlos de más valor estableciendo conexiones con otros repositorios que permitan enriquecerlos; garantizar su valor, evaluando y mejorando la calidad de lo que se publica; y asimismo ofrecer los mecanismos necesarios que faciliten su explotación. En este trabajo de tesis se ha propuesto un modelo para la publicación de datos abiertos enlazados que, a partir de un conjunto de datos obtenidos de diversas fuentes, facilita la publicación, enriquecimiento y validación de los datos, generando información útil y de calidad orientada a usuarios expertos y no expertos. Esta tesis presenta un enfoque multidimensional que define los pasos a seguir para la publicación, enriquecimiento y validación de datos abiertos enlazados. Las principales aportaciones son: · La definición de un modelo para la publicación de datos abiertos enlazados con un enfoque multidimensional basado en RDF Data Cube, que garantiza la confiabilidad en los datos, mejorando la explotación y promoviendo su reutilización efectiva. · El enriquecimiento de datos mediante repositorios externos como Wikidata y GeoNames. · La incorporación de una metodología para la evaluación de la calidad del conjunto de datos basado en el vocabulario RDF Data Cube. Tribunal: · Presidente: Isidro Ramos Salavert · Secretario: Alejandro Maté Morga · Vocal: Nieves Rodríguez Brisaboa Directores: · Jesús Peral · Manuel Marco |
[ Tancar ]