Hablar del ciclo de vida de los datos no es solo “una lista de etapas”; es la forma más práctica de entender dónde se crean los riesgos y dónde se genera valor. En términos generales, las fases más comunes incluyen: captura/adquisición, ingesta e integración, almacenamiento, preparación y calidad, análisis/uso, compartición/difusión, y finalmente retención y eliminación. La gobernanza se conecta con todas estas fases porque define “las reglas del juego”: quién puede hacer qué con los datos, con qué estándares de calidad, con qué controles de seguridad, cómo se documenta el linaje, y cómo se responde ante errores o incidentes.
Un ejemplo aplicable (sin entrar en números) sería el de una organización que gestiona información de clientes y operaciones: si la captura no tiene validaciones (formatos, rangos, campos obligatorios) la calidad se rompe desde el origen; si la integración no unifica identificadores, aparecen duplicados y versiones contradictorias; si el almacenamiento no contempla clasificación y control de acceso, se eleva el riesgo de exposición; si el uso analítico no está documentado, se toman decisiones con definiciones distintas por cada área. En ese sentido, la gobernanza “amarra” el ciclo completo para que los datos sean confiables y auditables, y para que el cumplimiento legal y ético no sea un “parche” al final.
Sobre buenas prácticas (pregunta 4), propongo un modelo simple por capas:
-
Calidad desde la fuente: reglas de validación al capturar, catálogos de valores, controles de duplicados y estándares de formato.
-
Trazabilidad y linaje: metadatos obligatorios (origen, fecha, responsable), bitácora de transformaciones y versionado de datasets.
-
Seguridad y acceso: clasificación de datos (sensibles/no sensibles), mínimo privilegio, registros de acceso, cifrado cuando corresponda.
-
Uso responsable: documentación de indicadores y definiciones, revisión de sesgos cuando hay analítica/IA, supervisión humana en decisiones críticas.
-
Retención y eliminación: políticas claras de cuánto tiempo se guarda, por qué, y cómo se elimina o anonimiza.
Este enfoque se alinea con marcos de gestión de riesgo en sistemas basados en datos e IA, que insisten en trazabilidad, transparencia y controles durante todo el ciclo, no solo en la etapa final
Referencia (APA):
National Institute of Standards and Technology. (2023). Artificial Intelligence Risk Management Framework (AI RMF 1.0). https://doi.org/10.6028/NIST.AI.100-1