24. Líam Osycka. Modelado Bottom-Up de Variedad de Dominio en Sistemas Big Data. Noviembre 2022

Título: «Modelado Bottom-Up de Variedad de Dominio en Sistemas Big Data”

Tesista: Líam Osycka

Directora: Dra. Alejandra Cechich

Carrera: Licenciatura en Sistemas de Información

Día:  18 de noviembre de 2022

Resumen

Big data se refiere a sistemas que manipulan grandes volúmenes de datos y que cumplen con las propiedades conocidas como las 5v’s: volúmen, velocidad, variedad, veracidad y variabilidad. Particularmente, la variedad es la que resalta la heterogeneidad presente en los datos, es decir, cómo y de qué manera son diferentes entre sí. Esta diversidad puede estudiarse desde el punto de vista de la estructura que poseen, el contenido que representan, los tipos de fuentes que se manejan y del procesamiento que reciben los datos. Estos tipos de variedad pueden extenderse si se los vincula al dominio en el que se los encuentran mediante el agregado de semántica, es decir, qué tipos de estructura, de contenido, de fuentes y de procesamiento suelen utilizarse bajo un dominio en particular. A esto denominamos variedad de contexto y es utilizada para permitir la reutilización de características identificadas dentro de dominios similares.  

Para identificar variedades presentes dentro de un dominio, este trabajo de tesis propone al proceso B-VIP (Bottom-up Variety Identification Process), el cual parte de las actividades del ciclo vida de big data y documenta las variedades encontradas en cada etapa haciendo uso de hojas de datos funcionales (datasheets), almacenadas en una base de conocimiento. Para dar soporte al proceso, se diseña e implementa la herramienta CoVaMaT, que permite nutrir esta base de conocimiento del dominio con el almacenamiento de las datasheets confeccionadas y los casos trabajados. Todo esto puede ser recuperado en situaciones futuras similares para un posible reuso.

B-VIP fue aplicado en dos casos de estudio, uno dentro del dominio de aguas superficiales (foco en ríos) con el objetivo de encontrar causas de variación de la temperatura del agua; y otro  en conjunto con INTA Alto Valle sobre aguas subterráneas (foco en acuíferos libres), donde se analizaron las causas e incidencias de cambios en el nivel freático.  Finalmente, se utilizó CoVaMaT para crear y exponer la base de conocimiento a partir de la variedad identificada en el primer caso de estudio  sobre aguas superficiales. 

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *