Otermín Sánchez, Facundo: Mejora de Recomendador de Foros de discusión: Utilización de bases de datos léxicas para evaluación de sinónimos, Diciembre 2018

Título: Mejora de Recomendador de Foros de discusión: Utilización de bases de datos léxicas para evaluación de sinónimos

Tesista: Facundo Otermín Sánchez

Directoras:  Dra. Nadina Martínez Carod – Lic. Valeria Zoratto

Carrera: Licenciatura en Ciencias de la Computación

Día y lugar: 7 de diciembre de 2018
 

Resumen

La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática en general suelen aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas de soporte han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizado para aprendizaje o como proveedor de soluciones de algún problema específico.

Los foros de discusión contienen un amplio conocimiento en diferentes temas y problemáticas, en este vasto volumen de información los usuarios enfrentan la dificultad de encontrar información relevante de manera efectiva. Si bien consultar foros de discusión sobre algún problema particular es una tarea cotidiana, pocas veces es una tarea sencilla ya que existe mucho contenido, por lo cual se debe hacer un análisis exhaustivo de las páginas disponibles para determinar cuáles de las soluciones presentadas sirven para el problema que se enfrenta, y si son las más adecuadas. 

Para poder brindar a los desarrolladores de software una herramienta que permita encontrar una solución correcta a sus problemas, utilizando la menor cantidad de intentos posible, se ha definido un proceso que utiliza las características de Recuperación de Información para analizar los hilos obtenidos de foros técnicos de discusión.

La herramienta original realizada a partir de la captura, mantenimiento y análisis de hilos de discusión existentes en foros técnicos, parte de una cadena de búsqueda sobre un tema referido al lenguaje de programación Java. Para mejorar los resultados obtenidos en esta herramienta, en esta tesis, se propone agregar nuevas funcionalidades léxicas y morfológicas, en particular la propuesta consiste en especializar el preprocesamiento realizado en los hilos de discusión, utilizando una base de datos léxica, en conjunto con herramientas que analizan la estructura gramatical de las oraciones, para mejorar los resultados obtenidos hasta el momento; específicamente utilizando la incorporación de sinónimos a determinadas palabras del post constituyentes de los hilos.

La extensión propuesta de la herramienta original agrega la posibilidad de elegir las clases gramaticales de las palabras a las cuales se les aplicará los sinónimos. Los resultados obtenidos en el caso de estudio utilizado han tenido una mejora en los resultados respecto a la herramienta original.

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *