El ciclo de vida de los datos es la manera como se dirigen desde su creación hasta su eliminación. Según el modelo DAMA-DMBOOK, tiene 6 fases que se sigue en la administración de los datos, estos son: Planificación definiendo las políticas y necesidades; la creación de los datos; Almacenamiento y mantenimiento de los datos; Procesamiento o análisis de los datos; Presentación y archivado; Eliminación de datos. Este es el proceso que normalmente se sigue, pero puede existir escenarios donde de una fase se regrese a otra, es flexible el ciclo.
La gobernanza de datos, son u conjunto de reglas para ejercer la autoridad y control sobre los datos, aunque en la gobernanza a los datos se los considera como activos, de esta manera se puede preservar la calidad, seguridad, el acceso y la privacidad, convirtiéndolo en un valor estratégico para le empresa. Esta gobernanza es indispensable en el entorno actual con varias regulaciones como la ley de protección de datos del Ecuador o la regulación de datos de Europa RGPD y en especial con surgimiento de IA.
U ejemplo podríamos tener con el Instituto Nacional de Estadística y Censos (INEC) de Ecuador con los censos y encuestas que realiza continuamente. En un inicio toman datos de la ciudadanía, contratando encuestadores para dicha tarea, si no tiene una gobernanza de datos efectiva con protocolos y validaciones estrictas para ejecutar la adquisición de datos en campo, pueden llegar a obtener encuestas falsas, por lo que la información que derive de estos datos se verá comprometida y los informes del INEC perderán credibilidad e incluso el gobierno podría tomar decisiones erróneas basados en esta información. En este punto es donde se aplica una máxima conocida como “Basura entra, basura sale”.
En revistas como MIS Quarterly recientemente, muestran que entre el 20% al 30% del tiempo de los analistas se pierden corrigiendo datos “sucios” originados en fases como adquisición o creación de datos (Strong, Lee & Wang, 1997; Redman, 2018). Un ejemplo actual lo tenemos con empresas retail como Target o Amazon han reportado pérdidas millonarias por pronósticos de demanda erróneos causados por datos históricos incompletos o mal capturados en sistemas POS (Waller & Fawcett, 2013)
Referencias:
Strong, D. M., Lee, Y. W., & Wang, R. Y. (1997). Data quality in context. MIS Quarterly, 21(1), 103–110. https://doi.org/10.2307/249797
Waller, M. A., & Fawcett, S. E. (2013). Data science, predictive analytics, and big data: A revolution that will transform supply chain design and management. Journal of Business Logistics, 34(2), 77–84. https://doi.org/10.1111/jbl.12010