Departamento de Lenguajes y Sistemas Informáticos

Comunicación

Título:Análisis estilométrico en Documentos Digitales Incorpóralo a tu calendario:
Tipo:Conferencia
Por:Daniel Castro DATYS SA, Santiago de Cuba, Cuba
Lugar:Sala Claude Shanon EPS IV
Día/hora:13:00 08/10/2018
Duración aproximada:1:00 hora
Persona de contacto:

Muñoz Guillena, Rafael (rafael[Perdone'm]dlsi.ua.es)
Resumen:
En las ciencias forenses, cada día aumenta la necesidad del empleo de métodos
computacionales que humanicen y aligeren el trabajo desarrollado por los
peritos. El análisis documental es una de las disciplinas que tradicionalmente
presenta, entre sus esferas de investigación, la construcción e identificación
de perfiles de autores y, más en detalle, la identificación de autoría de
documentos sospechosos. Desde sus inicios y aún en la actualidad, se analizan
los rasgos caligráficos en los textos manuscritos.
A partir del auge de la digitalización de la sociedad, se comienzan a presentar
investigaciones en las que es necesario identificar los rasgos de autores
de documentos digitales, aprovechando para esto el creciente desarrollo de
métodos de Inteligencia Artificial (IA), que involucran algoritmos de áreas
del Procesamiento del Lenguaje Natural (PLN), la Minería de Textos (MT),
el Reconocimiento de Patrones (RP), entre otros.
La comunidad científica, fundamentalmente a partir de la década de los 90,
dedica esfuerzos crecientes a la investigación y desarrollo de métodos y
algoritmos en la tarea de Análisis Estilométrico de documentos digitales,
profundizando en diferentes subtareas como por ejemplo: el Agrupamiento de
muestras de autores, la Detección de Plagio, la Detección y Verificación de
Autoría, entre otros.
El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de
Datos (MD), donde se persigue el propósito de minar un estilo o patrón de
redacción correspondiente y característico de un autor, a partir de los
documentos redactados por el mismo. Una de las aplicaciones o enfoques más
analizados en la comunidad internacional se corresponde con determinar el
autor de un documento anónimo o uno cuyo autor esté en duda. Para esto
es necesario intentar inferir características del autor a través de los
documentos escritos por él, estas características nos permitirán conformar
un modelo del estilo de este autor y medir qué tan similar puede ser un
documento cualquiera a los documentos escritos por dicho autor.
En la tarea de Detección de Plagio se persigue el propósito de identificar
las secciones de un documento que fueron tomadas de otras fuentes sin la
consecuente referencia al original.
En la presentación ilustraremos los algoritmos implementados en diferentes
tareas acometidas en el AA.
•	Detección de Plagio.
•	Verificación de Autoría.
•	Clustering de Autor.
•	Ofuscación del Autor
Por último expondremos las investigaciones a futuro que acometeremos en cada
una de las tareas abordadas.
[ Tancar ]