Departamento de Lenguajes y Sistemas Informáticos

Comunicación

Título:UN ENFOQUE MULTIDIMENSIONAL BASADO EN RDF PARA LA PUBLICACIÓN DE LINKED OPEN DATA Incorpóralo a tu calendario:
Tipo:Defensa tesis doctoral
Por:Pilar Escobar Esteban.
Lugar:Sala Google Meet: https://meet.google.com/azn-arek-ztc
Día/hora:11:00 07/07/2020
Duración aproximada:2:30 horas
Más información:https://edua.ua.es/es/secretaria/tesis-doctoral/tesis-en-proceso-de-tramitacion/maria-pilar-escobar-esteban.html
Persona de contacto:

Marco Such, Manuel (marco[Perdone'm]dlsi.ua.es)
Resumen:
Cada vez hay disponibles más datos de manera pública en Internet y surgen
nuevas bases de conocimiento basadas en conceptos de Linked Open Data (datos
abiertos enlazados), como DBPedia, Wikidata, YAGO o Google Knowledge Graph,
que cubren un amplio abanico de campos del conocimiento. Además, se incorporan
los datos que provienen de diversas fuentes como dispositivos inteligentes
o las redes sociales.

Sin embargo, que estos datos estén públicos y accesibles no garantiza que sean
útiles para los usuarios, no siempre se garantiza que sean confiables ni que
puedan ser reutilizados de manera eficiente. Actualmente, siguen existiendo
barreras que dificultan la reutilización de los datos, porque los formatos
son poco adecuados para el procesamiento automático y publicación de la
información, por falta de metadatos descriptivos y de semántica,duplicidades,
ambigüedad o incluso errores en los propios datos. A todos estos
problemas hay que añadir la complejidad del proceso de explotación de la
información de un repositorio de datos abiertos enlazados. El trabajo y
conocimientos técnicos que requiere el acceso, recolección, normalización y
preparación de los datos para que puedan ser reutilizados supone una carga
extra para los usuarios y organizaciones que quieran utilizarlos.

Para garantizar una eficiente explotación de los mismos, resulta fundamental
dotarlos de más valor estableciendo conexiones con otros repositorios
que permitan enriquecerlos; garantizar su valor, evaluando y mejorando la
calidad de lo que se publica; y asimismo ofrecer los mecanismos necesarios
que faciliten su explotación.

En este trabajo de tesis se ha propuesto un modelo para la publicación de
datos abiertos enlazados que, a partir de un conjunto de datos obtenidos
de diversas fuentes, facilita la publicación, enriquecimiento y validación
de los datos, generando información útil y de calidad orientada a usuarios
expertos y no expertos. Esta tesis presenta un enfoque multidimensional que
define los pasos a seguir para la publicación, enriquecimiento y validación
de datos abiertos enlazados.

Las principales aportaciones son:

  · La definición de un modelo para la publicación de datos abiertos enlazados
  con un enfoque multidimensional basado en RDF Data Cube, que garantiza
  la confiabilidad en los datos, mejorando la explotación y promoviendo su
  reutilización efectiva.
  · El enriquecimiento de datos mediante repositorios externos como Wikidata
  y GeoNames.
  · La incorporación de una metodología para la evaluación de la calidad
  del conjunto de datos basado en el vocabulario RDF Data Cube.

Tribunal:
  · Presidente: Isidro Ramos  Salavert
  · Secretario: Alejandro Maté Morga
  · Vocal: Nieves Rodríguez Brisaboa

Directores:
  · Jesús Peral
  · Manuel Marco
[ Tancar ]