Ciclo de vida de los datos

Ciclo de vida de los datos

de CHRISTIAN ROBERTO TAPIA GAIBOR -
Número de respuestas: 1

El ciclo de vida de los datos es la manera como se dirigen desde su creación hasta su eliminación. Según el modelo DAMA-DMBOOK, tiene 6 fases que se sigue en la administración de los datos, estos son: Planificación definiendo las políticas y necesidades; la creación de los datos; Almacenamiento y mantenimiento de los datos; Procesamiento o análisis de los datos; Presentación y archivado; Eliminación de datos. Este es el proceso que normalmente se sigue, pero puede existir escenarios donde de una fase se regrese a otra, es flexible el ciclo.

La gobernanza de datos, son u conjunto de reglas para ejercer la autoridad y control sobre los datos, aunque en la gobernanza a los datos se los considera como activos, de esta manera se puede preservar la calidad, seguridad, el acceso y la privacidad, convirtiéndolo en un valor estratégico para le empresa. Esta gobernanza es indispensable en el entorno actual con varias regulaciones como la ley de protección de datos del Ecuador o la regulación de datos de Europa RGPD y en especial con surgimiento de IA.

U ejemplo podríamos tener con el Instituto Nacional de Estadística y Censos (INEC) de Ecuador con los censos y encuestas que realiza continuamente. En un inicio toman datos de la ciudadanía, contratando encuestadores para dicha tarea, si no tiene una gobernanza de datos efectiva con protocolos y validaciones estrictas para ejecutar la adquisición de datos en campo, pueden llegar a obtener encuestas falsas, por lo que la información que derive de estos datos se verá comprometida y los informes del INEC perderán credibilidad e incluso el gobierno podría tomar decisiones erróneas basados en esta información. En este punto es donde se aplica una máxima conocida como “Basura entra, basura sale”.

En revistas como MIS Quarterly recientemente, muestran que entre el 20% al 30% del tiempo de los analistas se pierden corrigiendo datos “sucios” originados en fases como adquisición o creación de datos (Strong, Lee & Wang, 1997; Redman, 2018). Un ejemplo actual lo tenemos con empresas retail como Target o Amazon han reportado pérdidas millonarias por pronósticos de demanda erróneos causados por datos históricos incompletos o mal capturados en sistemas POS (Waller & Fawcett, 2013)

Referencias:

Strong, D. M., Lee, Y. W., & Wang, R. Y. (1997). Data quality in context. MIS Quarterly, 21(1), 103–110. https://doi.org/10.2307/249797

Waller, M. A., & Fawcett, S. E. (2013). Data science, predictive analytics, and big data: A revolution that will transform supply chain design and management. Journal of Business Logistics, 34(2), 77–84. https://doi.org/10.1111/jbl.12010


En respuesta a CHRISTIAN ROBERTO TAPIA GAIBOR

Re: Ciclo de vida de los datos

de MARíA PAULA DE LA CRUZ PADILLA -
Hola Christian, me pareció muy claro y bien explicado tu aporte sobre el ciclo de vida de los datos y la relación que haces con la gobernanza. Coincido contigo en que entender los datos como activos estratégicos es clave hoy en día, sobre todo considerando regulaciones como la Ley de Protección de Datos del Ecuador y el RGPD, más aún con el uso creciente de la inteligencia artificial.
El ejemplo que mencionas del INEC me parece muy acertado porque aterriza el concepto a un contexto real y cercano. Se nota claramente cómo una mala gestión en la fase de adquisición puede afectar no solo la calidad de la información, sino también la credibilidad de los resultados y las decisiones que se toman a partir de ellos. La frase “basura entra, basura sale” resume muy bien esta idea y ayuda a entender por qué las etapas iniciales del ciclo son tan críticas.
Como complemento a lo que mencionas, creo que la gobernanza de datos también debería enfocarse en generar una cultura organizacional orientada a la calidad, y no únicamente en normas o controles. Definir roles claros, como responsables de los datos o equipos encargados de su validación, puede marcar una gran diferencia para asegurar la trazabilidad y confiabilidad de la información a lo largo de todo el ciclo.
Además, me parece muy relevante el dato que compartes sobre el tiempo que los analistas dedican a limpiar datos. Esto refuerza la idea de que invertir más esfuerzo en la captura y el almacenamiento inicial puede ahorrar tiempo y recursos después, además de mejorar la calidad de los análisis y los pronósticos que se generan.
En general, tu intervención deja claro que una mala gestión del ciclo de vida de los datos no es solo un problema técnico, sino que tiene impactos reales a nivel organizacional y social. Fortalecer la gobernanza desde el inicio es fundamental para que la información realmente aporte valor.