Ciclo de vida de datos

Ciclo de vida de datos

de GABRIELA BRIGITH RODRIGUEZ GOMEZ -
Número de respuestas: 1

Hablar del ciclo de vida de los datos no es solo “una lista de etapas”; es la forma más práctica de entender dónde se crean los riesgos y dónde se genera valor. En términos generales, las fases más comunes incluyen: captura/adquisición, ingesta e integración, almacenamiento, preparación y calidad, análisis/uso, compartición/difusión, y finalmente retención y eliminación. La gobernanza se conecta con todas estas fases porque define “las reglas del juego”: quién puede hacer qué con los datos, con qué estándares de calidad, con qué controles de seguridad, cómo se documenta el linaje, y cómo se responde ante errores o incidentes.

Un ejemplo aplicable (sin entrar en números) sería el de una organización que gestiona información de clientes y operaciones: si la captura no tiene validaciones (formatos, rangos, campos obligatorios) la calidad se rompe desde el origen; si la integración no unifica identificadores, aparecen duplicados y versiones contradictorias; si el almacenamiento no contempla clasificación y control de acceso, se eleva el riesgo de exposición; si el uso analítico no está documentado, se toman decisiones con definiciones distintas por cada área. En ese sentido, la gobernanza “amarra” el ciclo completo para que los datos sean confiables y auditables, y para que el cumplimiento legal y ético no sea un “parche” al final.

Sobre buenas prácticas (pregunta 4), propongo un modelo simple por capas:

  1. Calidad desde la fuente: reglas de validación al capturar, catálogos de valores, controles de duplicados y estándares de formato.

  2. Trazabilidad y linaje: metadatos obligatorios (origen, fecha, responsable), bitácora de transformaciones y versionado de datasets.

  3. Seguridad y acceso: clasificación de datos (sensibles/no sensibles), mínimo privilegio, registros de acceso, cifrado cuando corresponda.

  4. Uso responsable: documentación de indicadores y definiciones, revisión de sesgos cuando hay analítica/IA, supervisión humana en decisiones críticas.

  5. Retención y eliminación: políticas claras de cuánto tiempo se guarda, por qué, y cómo se elimina o anonimiza.

Este enfoque se alinea con marcos de gestión de riesgo en sistemas basados en datos e IA, que insisten en trazabilidad, transparencia y controles durante todo el ciclo, no solo en la etapa final


Referencia (APA):
National Institute of Standards and Technology. (2023). Artificial Intelligence Risk Management Framework (AI RMF 1.0). https://doi.org/10.6028/NIST.AI.100-1


En respuesta a GABRIELA BRIGITH RODRIGUEZ GOMEZ

Re: Ciclo de vida de datos

de CARLOS JAVIER CASA ALBáN -
Esta conceptualización es muy coherente ya que se aplica directamente en dónde se rompe la calidad y dónde se produce riesgo. Pienso que se puede fortalecer considerando:
- Gobernanza que prioriza valor sin sacrificios:
Además de definir roles, controles y estándares, la gobernanza debería decidir qué datos merecen mayor inversión en calidad, monitoreo y seguridad según impacto. En la práctica, no todo dato necesita el mismo tratamiento: por ejemplo, lecturas de medidores para facturación versus datos exploratorios para análisis puntual. Sin esa priorización, el modelo por capas puede volverse inútil pero costoso o lento para operación.
- Poner énfasis en el “hilo conductor” operativo: metadatos con SLAs de datos.
Al los metadatos y linaje mencionados, añadiría explícitamente un “contrato” o SLA de datos: frecuencia, latencia, tolerancia a error, reglas de calidad mínimas y responsable. Esto es clave cuando hay integración entre áreas (comercial, operaciones, TI) y cuando se quiere trazabilidad real: no solo “quién transformó”, sino si el dato llegó a tiempo y con el nivel de calidad esperado.
Como ejemplo de aplicación:
En consumos, una alerta de anomalía sirve poco si llega tarde o si cada área maneja definiciones distintas de “consumo anómalo”. El contrato de datos obliga a acordar definición , validaciones, rangos de tolerancia , quién actúa. Ahí se ve la gobernanza como algo práctico, y no documental.
Referencia:
• IBM. (s. f.). Data lifecycle management (DLM). Recuperado el 2 de febrero de 2026, de https://www.ibm.com/es-es/think/topics/data-lifecycle-management
• DAMA International. (2017). The DAMA Guide to the Data Management Body of Knowledge (DAMA-DMBOK2) (2nd ed.). Technics Publications.