¿Cuáles son las principales fases del ciclo de vida de los datos e información y cómo se relacionan con la gobernanza de datos en la actualidad?
Las fases que comprende el ciclo de vida de los datos e información empiezan desde la generación de datos hasta llegar a la disposición final. En la gobernación de datos es muy importante, por tal motivo están totalmente relacionadas, ya que permite gestionar datos de manera integral.
La gobernanza de datos funciona como el pilar estratégico que da estructura y propósito a todas estas etapas. A través de ella se definen reglas precisas, niveles aceptables de calidad, salvaguardas de seguridad y distribución clara de obligaciones, lo que asegura que los datos se conviertan en un recurso fiable, protegido y útil para la organización (Sebastian-Coleman, 2022).
Por ejemplo en el Servicio de Rentas Internas (SRI), la gobernanza fija procedimientos claros y rigurosos para registrar la información fiscal de manera precisa, completa y sin dejar huecos ni omisiones, lo cual también sirve para poder detectar posibles fraudes y sancionarlos a tiempo.
¿En qué medida la calidad de los datos en las etapas iniciales del ciclo (captura, almacenamiento) condiciona el valor de la información generada posteriormente?
La calidad que logramos en las fases de ingreso y resguardo inicial marca en gran medida, y muchas veces de forma decisiva, el verdadero potencial y la utilidad real de toda la información que se obtiene más adelante en el ciclo. Fallos como registros incompletos, repeticiones, imprecisiones o prejuicios introducidos al principio se trasladan y se intensifican a medida que avanzan las operaciones, contaminando los análisis, los modelos predictivos y las conclusiones finales. Redman (2022) explica que “los inconvenientes provocados por datos de mala calidad no aumentan de forma gradual, sino que se expanden exponencialmente cuando se llega a la integración y al uso sofisticado, lo cual destruye la confianza en los hallazgos y origina gastos significativos en remedios y pérdidas de oportunidades”. (p. 47).
Un caso típico ocurre en el sector bancario al construir sistemas de calificación crediticia. Si los historiales de pagos y comportamientos de los clientes (recopilados en las etapas iniciales) presentan errores de digitación, formatos no uniformes o datos faltantes, los algoritmos de aprendizaje automático que se alimentan de esa base generan pronósticos distorsionados, poco precisos. Esto sucede independientemente de la sofisticación de las herramientas analíticas aplicadas después. Como resultado, no solo se reduce la utilidad práctica de la puntuación del cliente, sino que se incrementan los riesgos económicos y se pueden incumplir estándares éticos o legales. Invertir en controles de calidad desde el arranque no representa un desembolso innecesario, sino el fundamento clave para generar conocimiento válido, respaldar decisiones acertadas y responder adecuadamente a regulaciones cada vez más exigentes en materia de datos.
Referencias
Redman, T. C. (2022). Data driven: Profiting from your most important business asset. Harvard Business Review Press.
Sebastian-Coleman, L. (2022). Navigating the Labyrinth: An Executive Guide to Data Management. Technics Publications.