Department of Software and Computing Systems

Lecture

Title:Análisis estilométrico en Documentos Digitales Import to your calendar:
[CSV]
Conferència
Presenter:Daniel Castro DATYS SA, Santiago de Cuba, Cuba
Venue:Sala Claude Shanon EPS IV
Date&time:13:00 08/10/2018
Estimated duration:1:00 hora
Contact person:

Muñoz Guillena, Rafael (rafael[Perdone'm]dlsi.ua.es)
Abstract:
En las ciencias forenses, cada día aumenta la necesidad del empleo de métodos
computacionales que humanicen y aligeren el trabajo desarrollado por los
peritos. El análisis documental es una de las disciplinas que tradicionalmente
presenta, entre sus esferas de investigación, la construcción e identificación
de perfiles de autores y, más en detalle, la identificación de autoría de
documentos sospechosos. Desde sus inicios y aún en la actualidad, se analizan
los rasgos caligráficos en los textos manuscritos.
A partir del auge de la digitalización de la sociedad, se comienzan a presentar
investigaciones en las que es necesario identificar los rasgos de autores
de documentos digitales, aprovechando para esto el creciente desarrollo de
métodos de Inteligencia Artificial (IA), que involucran algoritmos de áreas
del Procesamiento del Lenguaje Natural (PLN), la Minería de Textos (MT),
el Reconocimiento de Patrones (RP), entre otros.
La comunidad científica, fundamentalmente a partir de la década de los 90,
dedica esfuerzos crecientes a la investigación y desarrollo de métodos y
algoritmos en la tarea de Análisis Estilométrico de documentos digitales,
profundizando en diferentes subtareas como por ejemplo: el Agrupamiento de
muestras de autores, la Detección de Plagio, la Detección y Verificación de
Autoría, entre otros.
El Análisis de Autoría (AA) es una subtarea en el campo de la Minería de
Datos (MD), donde se persigue el propósito de minar un estilo o patrón de
redacción correspondiente y característico de un autor, a partir de los
documentos redactados por el mismo. Una de las aplicaciones o enfoques más
analizados en la comunidad internacional se corresponde con determinar el
autor de un documento anónimo o uno cuyo autor esté en duda. Para esto
es necesario intentar inferir características del autor a través de los
documentos escritos por él, estas características nos permitirán conformar
un modelo del estilo de este autor y medir qué tan similar puede ser un
documento cualquiera a los documentos escritos por dicho autor.
En la tarea de Detección de Plagio se persigue el propósito de identificar
las secciones de un documento que fueron tomadas de otras fuentes sin la
consecuente referencia al original.
En la presentación ilustraremos los algoritmos implementados en diferentes
tareas acometidas en el AA.
•	Detección de Plagio.
•	Verificación de Autoría.
•	Clustering de Autor.
•	Ofuscación del Autor
Por último expondremos las investigaciones a futuro que acometeremos en cada
una de las tareas abordadas.

[ Close ]