| Abstract: | Junto a la explosión de la Web 2.0, nuevos tipos de
textos, como foros o blogs, han incrementado su presencia
de una manera exponencial. Estos nuevos tipos de texto
se caracterizan principalmente por su alto contenido
subjetivo ya que reflejan las opiniones de los usuarios a
cerca de una amplia variedad de temas que afectan a las
personas en muchos aspectos de su vida diaria. Por esta
razón muchos investigadores en Procesamiento del Lenguaje
Natural (PLN) han abarcado el problema de su tratamiento y
explotación, dando lugar a lo que se ha denominado analisis
de sentimientos. Sin embargo, los sistemas tradicionales de
PLN no están pensados para el tratamiento de la información
subjetiva y los sentimientos. Por ello en esta tesis
se plantea analizar un tratamiento, procesamiento, e
interpretacion efectivos de la información subjetiva. Esto
conlleva la creación de sistemas para el entrenamiento
y el testeo de procesos de distintos generos textuales y
con varios niveles de granularidad.
Para poder contribuir a este objetivo este trabajo:
- analiza y propone un esquema de anotacion a granularidad
fina para poder capturar todos los matices del lenguaje
y expresiones empleadas en los nuevos textuales
- anota una colección de entradas de blogs utilizando el
esquema de anotación propuesto
- evalua intínsecamente la estabilidad del modelo de
anotación creando modelos de aprendizaje automático con
los elementos anotados, midiendo así el impacto de cada
elemento
- evalua extrínsecamente la eficiencia del modelo y
del corpus anotado aplicándolo a varias tareas de PLN:
minería de opiniones, búsqueda de respuestas y generación
de resúmenes automáticos
|