Sebastián Yaupe. Especificación de Procesos para Preparación de Datos en Sistemas Big Data. Abril 2023

Título: «Especificación de Procesos para Preparación de Datos en Sistemas Big Data”

Tesista: Sebastián Yaupe

Directora: Dra. Alejandra Cechich

Carrera: Licenciatura en Sistemas de Información

Día:  27 de abril de 2023

Resumen

Para extraer información de los datos en sistemas big data, los mismos deben atravesar una serie de escenarios con diferentes funciones, como ingestión, filtrado, transformación, etc.

Considerando la necesidad de entender estos escenarios, existen antecedentes en el modelado de la preparación de los datos para depósitos de datos, que describen actividades relevantes. En particular, se asocia el concepto de procesos considerando que un proceso es una concatenación lógica de actividades, a través del tiempo y lugar, impulsadas por eventos y que a través de su proceso de transformación, cumplen un determinado fin.

Esta definición contiene un elemento esencial en la especificación de procesos – las actividades — que se pueden definir como acciones sobre un objeto, debido a que el proceso de transformación ocurre a través de  ellas. Las actividades están encadenadas a través de una secuencia lógica, que determina en su conjunto las condiciones y capacidades.  

En la literatura se utilizan varios términos para sistemas que implementan procesos: sistema de workflow (WfM), Business Process Management Suite (BPMS), motor de workflow y Process Engine. La importancia de la gestión de flujos de trabajo (workflows) viene de la posibilidad de representar explícitamente las estructuras de los procesos en los modelos  y en la actuación controlada sobre los procesos de  acuerdo a esos modelos. 

Con estas consideraciones, este trabajo de tesis se enfoca en incorporar modelado de workflows de procesos en actividades para preparación de datos utilizando BPMN; pero a diferencia de trabajos relacionados, se propone extender a particularidades propias de sistemas big data, como actividades en lagos de datos. El modelo resultante de esta de tesis es instanciado en un caso de estudio en el dominio geoespacial (análisis de turbidez en el Canal Principal de Riego del Alto Valle), para mostrar su aplicabilidad y la especialización requerida en la instanciación específica.

Dejá un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *