Jaime Saldivia: Clasificación de posts en foros de discusión. Junio 2023

Título: Clasificación de posts en foros de discusión

Autor: Jaime Saldivia Urra

Director: Dra. Gabriela Aranda – Lic. Valeria Zoratto

Carrera: Licenciatura en Ciencias de la Computación

Fecha de defensa: 12 de junio de 2023

Resumen

Los foros de discusión son medios muy populares en la Web, donde usuarios comunes plantean dudas y piden ayuda u opiniones a otros usuarios con intereses similares, para solucionar problemas de distinto tipo.

En este contexto, un hilo de discusión típico es una secuencia de mensajes (posts) que han sido escritos por distintos usuarios y donde cada uno de ellos suele tener un propósito distinto y proveer distinto tipo de información.

Dichos hilos de discusión suelen ser interesantes no solo para quienes los escribieron, sino que también suelen ser fuente de consulta para otros usuarios de la Web con inquietudes similares, por lo que la recuperación de información y clasificación de dichos mensajes es un tema de investigación que se ha difundido en los últimos años.

Entre otros, un tema de interés actual es detectar cuál o cuáles de los posts que contienen dichos hilos son los que plantean dudas y cuáles son los que presentan posibles soluciones. Pero, además pueden existir en el hilo otros tipos de mensajes que enriquecen la discusión, como los que piden más detalles sobre el problema planteado, los que repiten una pregunta anterior, los que dan más detalles del contexto, los que reportan buenas o malas experiencias aplicando las soluciones propuestas; y otros que no aportan más que confusión o ruido a la discusión, comúnmente llamados mensaje basura.

Para identificar el rol que cumple cada post dentro de un hilo de discusión, existen varios modelos de clasificación propuestos, los cuales emplean características de distinto tipo. Entre los tipos de características utilizadas más comunes se encuentran las basadas en el contenido de los posts y en la estructura de la secuencia o del hilo. También suele ser utilizada información disponible en el foro sobre los usuarios participantes, y en algunos trabajos puntuales se ha incorporado el análisis de opinión o sentimiento del texto.

Con el fin de aportar en este tema de investigación, esta tesis se enfoca en definir un conjunto de características para clasificar mensajes de foros de discusión de acuerdo a su rol en el hilo. Para ello, se analizaron y compararon distintos modelos provenientes del análisis de literatura relacionada y se propuso extender uno de ellos con el objetivo de mejorar la clasificación del modelo original. Dicha propuesta se evaluó en dos sets de datos provenientes de hilos de discusión reales, obteniéndose resultados prometedores.

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *