¿Qué es la gobernanza de datos?

¿Qué es la gobernanza de datos?

La gobernanza de datos es la disciplina de gestión de datos que se enfoca en la calidad, la seguridad y la disponibilidad de los datos de una organización. La gobernanza de datos ayuda a garantizar la integridad de los datos y la seguridad de los datos mediante la definición e implementación de políticas, estándares y procedimientos para la recopilación, propiedad, almacenamiento, procesamiento y uso de los datos.

El objetivo de la gobernanza de datos es mantener datos seguros y de alta calidad que sean fácilmente accesibles para el descubrimiento de datos, las iniciativas de business intelligence y los esfuerzos de IA. Al actuar más bien como un centro de control de tráfico aéreo, la función de gobernanza de datos ayuda a garantizar que los datos verificados fluyan a través de pipelines seguros hacia endpoints confiables.

La inteligencia artificial (IA), el big data y los esfuerzos de transformación digital son los principales factores de los programas de gobernanza de datos. A medida que aumenta el volumen de datos procedentes de nuevas fuentes de datos, como las tecnologías de Internet de las cosas (IoT), las organizaciones están reconsiderando sus prácticas de gestión de datos y los principios de gobernanza de datos. La adopción de las prácticas y principios correctos puede ayudar a las organizaciones a escalar los esfuerzos de business intelligence (BI) y tomar decisiones más informadas.

Los rápidos avances en el campo de la IA empresarial también han exigido nuevas estrategias para la gobernanza de datos. Cada vez más, los programas de gobernanza deben tener en cuenta los datos estructurados y no estructurados que sirven como entradas o salidas de los sistemas RAG, las bases de datos vectoriales y los agentes de IA.

Los programas robustos de gobernanza de datos pueden ayudar a las organizaciones a proteger y gestionar grandes cantidades de datos al mejorar la calidad de los datos, reducir los silos de datos, aplicar políticas de cumplimiento y seguridad y distribuir el acceso a los datos de manera adecuada.

La gobernanza de datos frente a la administración de datos

La gobernanza de datos es un subconjunto de la gestión de datos, que es la práctica general de recopilar, procesar y utilizar datos de forma segura y eficiente para respaldar la toma de decisiones estratégicas y mejorar los resultados empresariales.

Si bien la gestión de datos incluye la gobernanza de datos, también incluye otras áreas del ciclo de vida de estos, como el procesamiento, el almacenamiento y la seguridad de los datos. Además, los diversos aspectos del proceso de gestión de datos tienen una influencia recíproca.

Debido a que estas otras áreas de gestión de datos pueden afectar la gobernanza de datos, varios equipos deben trabajar juntos para diseñar y seguir una estrategia de gobernanza de datos.

Por ejemplo, un equipo de gobernanza de datos podría identificar puntos en común entre conjuntos de datos dispares. Si desean integrar esos datos, generalmente trabajarán con un equipo de gestión de datos para definir el modelo y la arquitectura de datos para facilitar esos vínculos. Diferentes estrategias podrían ser apropiadas para los datos en la nube frente a los datos alojados on premises.

Otro ejemplo es el acceso a los datos, donde un equipo de gobernanza de datos podría establecer las políticas relativas al acceso a tipos específicos de datos, como información de identificación personal (PII). Luego, un equipo de gestión de datos proporcionará ese acceso, ya sea directamente o a través de la creación del mecanismo para proporcionarlo, a menudo mediante el control de acceso basado en roles (RBAC). Obtener los permisos de acceso correctos es aún más importante en una era en la que, cada vez más, un agente de IA en lugar de un empleado humano accede a los datos.

Marcos de gobernanza de datos

Un marco de gobernanza de datos detalla las estructuras y procesos de una organización para gestionar activos críticos de datos. Define la propiedad y las responsabilidades de los datos y especifica cómo deben manejarse los datos para mantener los estándares de calidad de los datos, la seguridad y el cumplimiento.

No existe un solo marco que funcione para todos los casos, ya que estos suelen ser hojas de ruta personalizadas para los sistemas de datos, las fuentes de datos, los protocolos de la industria y las regulaciones del gobierno específicos de una organización en particular. Y los marcos antiguos pueden quedar obsoletos rápidamente. Los marcos deben tener cada vez más en cuenta la IA, los sistemas multinube y los entornos de datos que avanzan más rápido.

Los marcos de gobernanza de datos suelen abordar aspectos como:

  • Objetivos, funciones y tareas del programa
  • Estándares, políticas y procesos de datos
  • Procedimientos de auditoría
  • Herramientas de gobernanza de datos

Objetivos, funciones y tareas del programa

Los programas de gobernanza de datos generalmente definen un objetivo específico o un conjunto de objetivos, como mejorar la calidad de los datos, respaldar el cumplimiento normativo o permitir la toma de decisiones basada en datos. También seleccionan métricas para medir el avance logrado para alcanzar estos objetivos. Las métricas de gobernanza clave podrían incluir:

  • Reducciones en errores de datos y redundancia.

  • Reducciones de costos gracias a una mayor eficiencia y un tiempo de comercialización más rápido.

  • Coherencia e integridad de los datos.

  • El nivel de conocimientos sobre los datos y cumplimiento de procesos de los empleados.

Los programas de gobernanza también definen las funciones y responsabilidades de todos los involucrados: el comité directivo, los propietarios de datos, los administradores de datos y los stakeholders.

  • Los miembros del comité directivo o consejo de gobernanza están a cargo de la supervisión de la estrategia de gobernanza de datos y la dirección general de la infraestructura. Este comité a menudo está formado por la alta dirección, como directores ejecutivos o vicepresidentes, que supervisan varios departamentos.

  • Los propietarios de los datos supervisan los dominios de datos específicos en todas las unidades de negocio. Estas personas son responsables de mantener la precisión, calidad y coherencia de los datos, y ofrecen entrada sobre soluciones de gobernanza de datos, políticas de datos y requisitos normativos.

  • Los administradores de datos se encargan de la gestión diaria de dominios de datos específicos.

  • Los stakeholders y los equipos de negocios son los consumidores de datos empresariales.

Estándares, políticas y procesos de datos

Los marcos de gobernanza establecen parámetros en torno a los datos que se van a gobernar y los resultados deseados. Este proceso incluye el establecimiento de lineamientos para formatos de datos, modelos de datos, gestión de datos maestros (MDM), metadatos, convenciones de nomenclatura y más. 

Los marcos de gobernanza a menudo mapean los flujos de datos y definen cómo se recopilarán, almacenarán, duplicarán, moverán y archivarán los datos. También pueden identificar el hardware, el software y los servicios que respaldarán los esfuerzos de gobernanza y la arquitectura de datos más general de la organización.

Algunas infraestructuras de gobernanza pueden definir alcances de datos, que son parámetros de acceso para activos de datos específicos, como datos maestros, metadatos y datos históricos. Un alcance de datos puede ayudar a garantizar que los usuarios y las aplicaciones solo tengan acceso a los datos que necesitan y que nadie tenga acceso a los datos que no deberían.

Procedimientos de auditoría

Los marcos de infraestructura describen procedimientos de prueba, auditoría y registros para mantener la transparencia y explicabilidad del programa de gobernanza.

Las auditorías periódicas o continuas pueden ayudar a verificar en tiempo real que los usuarios cumplen con la infraestructura de gobernanza de datos. Las auditorías también pueden ayudar a identificar las formas en que el programa de gobernanza debe evolucionar para tener en cuenta nuevos datos, procesos o tecnologías.

Por último, las auditorías también pueden ayudar a las organizaciones a lograr y demostrar el cumplimiento normativo.

Herramientas de gobernanza de datos

La tecnología desempeña una función importante en la gobernanza de datos eficaz. Las herramientas de gobernanza de datos empresariales pueden variar desde plataformas integrales hasta soluciones puntuales especializadas. Las organizaciones eligen diferentes herramientas en función de sus arquitecturas de datos y marcos únicos de gobernanza.

Entre las capacidades comunes de las soluciones de gobernanza de datos se encuentran:

  • Descubrimiento de datos y clasificación automáticos.

  • Aplicación de las normas de protección de datos y de los controles de acceso basados en roles.

  • Satisfacer los requisitos de privacidad de datos y cumplimiento normativo.

  • Automatización de la gestión de metadatos, catalogación de datos y seguimiento del linaje de datos.

  • Admitir un glosario empresarial.

Las soluciones de gobernanza de datos pueden manejar varios formatos de datos. Algunos ofrecen capacidades de visualización para mejorar la comprensión de conjuntos de datos complejos y relaciones, lo que facilita la identificación de tendencias, valores atípicos y áreas que requieren atención. Cada vez más, las soluciones de gobernanza de datos pueden ayudar a gestionar los datos que se utilizan en los pipelines de IA.

Academia de IA

¿Es la gestión de datos el secreto de la IA generativa?

Explore por qué los datos de alta calidad son esenciales para el uso exitoso de la IA generativa.

Beneficios de la gobernanza de datos

La implementación de un marco sólido de gobernanza de datos puede ayudar a las organizaciones a obtener una amplia variedad de beneficios:

  • Obtener más valor de los datos empresariales.
  • Promover la innovación y la eficiencia.
  • Proporcionar una única fuente de información (SSOT).
  • Ayudar a garantizar la privacidad de datos, la seguridad y el cumplimiento normativo.
  • Utilizar datos de forma segura para iniciativas de IA.
  • Habilitar analytics de datos más precisos.

Obtener más valor de los datos empresariales.

Las organizaciones no pueden tomar decisiones comerciales efectivas si esas decisiones se fundamentan en datos incorrectos. La gobernanza de datos puede ayudar a garantizar la integridad, la precisión, la integridad y la coherencia de los datos mediante la creación de una infraestructura que respalde una robusta administración de datos y un sólido proceso de gestión de datos de principio a fin.

Los datos confiables ayudan a las organizaciones a descubrir nuevas oportunidades, comprender mejor a sus clientes y flujos de trabajo, así como a optimizar el rendimiento general del negocio.

La falta de gobernanza de datos puede provocar errores en las métricas de rendimiento, orientando a una organización en la dirección equivocada. Mientras tanto, las herramientas de gobernanza de datos pueden abordar las imprecisiones antes de que influyan en la estrategia empresarial.

Por ejemplo, las herramientas de linaje de datos pueden ayudar a los propietarios de datos a rastrear los datos a lo largo de su ciclo de vida, incluyendo cualquier transformación que experimenten los datos durante los procesos de extracción, transformación, carga (ETL) o extracción, carga, transformación (ELT). Esta característica permite a las organizaciones identificar y corregir la causa principal de los errores de datos.

Promover la innovación y la eficiencia.

Cuando el acceso a los datos está restringido en toda una organización, puede limitar la innovación, crear dependencias en los expertos en la materia (SME) y ralentizar los procesos de negocio.

Los programas de gobernanza de datos distribuyen el acceso a los datos de manera adecuada, otorgando a cada departamento o persona acceso solo a los datos que necesitan. Este proceso permite que los equipos multifuncionales trabajen juntos de manera más cercana y eficiente mientras mantienen los datos seguros. 

Proporcionar una única fuente de información (SSOT).

Un sistema de datos gestionado de manera correcta puede proporcionar una única fuente de información en toda la organización. La toma de decisiones puede mejorar cuando todas las partes trabajan con los mismos conjuntos de datos.

Centralizar las definiciones de datos y metadatos en un único catálogo de datos puede ayudar a reducir la confusión y la ineficacia. Esta documentación, a su vez, se convierte en la base de las soluciones de autoservicio que permiten la coherencia de los datos y el acceso a los mismos en toda la organización.

Ayudar a garantizar la privacidad de datos, la seguridad y el cumplimiento normativo.

Las políticas de gobernanza de datos a menudo incluyen operaciones para cumplir de manera más sencilla con las regulaciones establecidas por el gobierno con respecto a los datos confidenciales y la privacidad, como el Reglamento General de Protección de Datos (RGPD) de la UE, la Ley de Portabilidad y Responsabilidad del Seguro Médico de EE. UU. y requisitos de las industrias, como las Normas de Seguridad de Datos de la Industria de Tarjetas de Pago (PCI DSS). Los últimos años también han visto el advenimiento de la regulación centrada en la IA con componentes de datos; algunos ejemplos incluyen la Ley de IA de la UE, la Ley de Datos de la UE y DORA. Las infracciones de estos requisitos normativos podrían dar lugar a costosas multas gubernamentales y reacciones negativas del público.

Las herramientas de gobernanza de datos ayudan a las organizaciones a establecer medidas de protección que pueden prevenir filtraciones, fugas y uso indebido de datos. Los marcos de gobernanza ayudan desarrollar sistemas de datos que sean claros, explicables, justos e inclusivos. A su vez, estos sistemas de datos protegen la privacidad y la seguridad y mantienen la lealtad y la confianza de los clientes.

Utilizar datos de forma segura para iniciativas de IA.

En una encuesta de IDC, solo el 45.3 % de los encuestados afirmó contar con normas y procesos para aplicar los principios de IA responsable con el fin de protegerse contra las violaciones de seguridad, los problemas de responsabilidad civil y los riesgos normativos.1

La gobernanza de datos requiere que se conozca el origen, la sensibilidad y el ciclo de vida de todos los datos que usa una organización. Esta comprensión es la base de cualquier práctica de gobernanza de la IA y es crucial para mitigar diversos riesgos empresariales.

La gobernanza de datos ayuda a las organizaciones a aportar datos de alta calidad a las iniciativas de IA y machine learning (ML), además de que protege dichos datos y permite el cumplimiento con las normas y regulaciones pertinentes. Por ejemplo, las herramientas de gobernanza pueden ayudar a garantizar que no se suministren datos personales confidenciales a una IA cuando no debería ser así.

Habilitar analytics de datos más precisos.

Contar con los datos correctos es la base de las iniciativas avanzadas de analytics de datos y ciencia de datos. Los datos gobernados de manera cuidadosa permiten establecer iniciativas valiosas, como informes de business intelligence o proyectos de machine learning (ML) predictivo más complejos.

Por ejemplo, la creación adecuada de perfiles de datos (comentarios y limpieza de datos para comprender mejor cómo están estructurados) puede ayudar a comprender mejor la relación entre los diferentes conjuntos de datos y fuentes.

Desafíos de la gobernanza de datos

Las iniciativas de gobernanza de datos pueden enfrentar muchos obstáculos en la implementación. Algunos de estos desafíos incluyen:

  • Falta de patrocinio adecuado
  • Arquitectura de datos inconsistente
  • Visibilidad y control de datos
  • Mayor demanda de acceso
  • Requisitos de datos de IA

Falta de patrocinio adecuado

Los programas de gobernanza de datos eficaces suelen requerir el patrocinio de dos niveles: el de los ejecutivos y el de quienes realizan aportaciones individuales. Los directores de datos (CDO) y los administradores de datos son críticos en la comunicación y la priorización de la gobernanza de datos dentro de una organización.

Los CDO pueden supervisar y hacer cumplir la responsabilidad en todos los equipos de datos para ayudar a garantizar que se adopten las políticas de gobernanza de datos. Los administradores de datos pueden ayudar a promover el conocimiento de estas políticas entre los productores y consumidores de datos para fomentar el cumplimiento en toda la organización. 

Sin el patrocinio adecuado, es posible que los usuarios de datos desconozcan las políticas de gobernanza o no se preocupen por ellas. Esta situación puede llevar al incumplimiento, una integridad de datos deficiente y una seguridad de datos comprometida.

Arquitectura de datos inconsistente

Sin las herramientas y la arquitectura de datos correctas, las organizaciones podrían tener dificultades para desplegar un programa eficaz de gobernanza de datos.

Por ejemplo, los equipos pueden descubrir datos redundantes en diferentes funciones. Para permitir una gobernanza eficaz, los data architects deben desarrollar modelos de datos y arquitecturas de datos adecuados para fusionar e integrar datos en todos los sistemas de almacenamiento.

Es posible que los equipos también necesiten adoptar un catálogo de datos para crear un inventario de activos de datos en una organización. O si ya tienen uno, es posible que necesiten crear un proceso para la gestión de metadatos que ayude a garantizar que los datos subyacentes sean relevantes y estén actualizados.

Visibilidad y control de datos

La gobernanza de datos, especialmente en entornos híbridos y multinube, a menudo conlleva que los datos estén almacenados en múltiples formatos en múltiples proveedores y ubicaciones. Además, los datos pueden residir en diferentes tipos de almacenes de datos, como data lakesdata lakehouses y data warehouses.

La TI en la sombra puede arrojar una llave adicional al proceso. En un estudio de TechTarget, el segundo desafío de seguridad de datos más común informado fue que los empleados se registraban en aplicaciones y servicios en la nube sin la aprobación de TI.2

Esta distribución de datos puede dificultar el seguimiento y el monitoreo de los flujos de datos y el uso de datos. La gobernanza de datos requiere un conocimiento claro de las fuentes de datos, los destinos, las transformaciones, las dependencias, la propiedad, los derechos de acceso y las responsabilidades.

La aplicación de políticas de gobernanza de datos en múltiples entornos puede requerir la coordinación entre diferentes stakeholders, como propietarios de datos, administradores de datos, consumidores de datos y reguladores de datos.

Mayor demanda de acceso

El auge de los analytics de autoservicio y business intelligence presenta nuevos desafíos para la gobernanza de datos.

Las solicitudes de acceso de más usuarios llegan más rápido que antes, pero los equipos de gobernanza deben equilibrar la velocidad y la accesibilidad con las preocupaciones de privacidad y seguridad. Además, los sistemas y procedimientos de transmisión de datos deben ajustarse con precisión para evitar la fuga de datos.

Requisitos de datos de IA

Al proporcionar los datos que impulsan el entrenamiento y las operaciones de la IA, muchas herramientas de almacenamiento de datos resultan insuficientes.

Al fin y al cabo, la IA es más compleja de manera inherente que los procesos y capacidades estándar impulsados por la TI, lo que aumenta la importancia de una gobernanza de datos activa e informada. En un informe de KPMG se destaca la brecha de gobernanza de la IA como uno de los principales riesgos que amenazan actualmente a las empresas.3 Por ejemplo, sin las medidas de protección adecuadas, la IA podría exponer de manera involuntaria información de identificación personal confidencial o secretos corporativos. Esos riesgos pueden resultar aún más costosos en una época en la que se intensifican las regulaciones relacionadas con la IA (como la Ley de IA de la UE, aprobada en junio de 2024).

Para reducir los riesgos y las complejidades de la IA, las organizaciones pueden combinar capacidades de almacenamiento de datos optimizadas para IA con programas de gobernanza de datos diseñados teniendo en cuenta la IA.

Mejores prácticas de gobernanza de datos

La planeación y creación de un marco de gobernanza de datos requiere tiempo y esfuerzo por parte de múltiples stakeholders y equipos. Entre las prácticas comunes que utilizan las organizaciones al implementar programas de gobernanza se encuentran:

  • Automatizar para una mayor eficiencia
  • Equilibrar la comodidad y la seguridad de los datos
  • Construir un catálogo de datos
  • Utilizar modelos de madurez
  • Monitorear y mejorar continuamente

Automatizar para una mayor eficiencia

Automatizar ciertas partes del proceso de gobernanza de datos puede ayudar a mejorar la eficiencia y reducir errores. Las herramientas de gestión y gobernanza de datos pueden ayudar a automatizar tareas rutinarias como:

  • Construir linajes de datos para ayudar a visualizar el flujo de datos a través de los sistemas sin necesidad de soluciones complejas programadas de forma manual.

  • Propagar políticas para asignar etiquetas de metadatos a elementos de datos específicos, como columnas o tablas, para identificarlos como información confidencial.

  • Generar registros de auditoría para registrar las interacciones de datos y comprender cómo los empleados utilizan los datos.

La clasificación de datos se basa en categorías predefinidas, como PII, datos financieros, propiedad intelectual o información confidencial.

Equilibrar la comodidad y la seguridad de los datos

La seguridad de los datos y los controles de acceso sólidos son fundamentales para cualquier marco de gobernanza de datos. Al mismo tiempo, las organizaciones quieren que el acceso a los datos sea lo más fluido posible para los usuarios con la autorización para ver y usar conjuntos de datos específicos. Sin este fácil acceso a la información de autoservicio, la colaboración y los nuevos insights se ven obstaculizados.

Construir un catálogo de datos

Muchas organizaciones tienen dificultades para gestionar sus datos debido a la falta de visibilidad. Un catálogo de datos central puede funcionar como la única fuente de información, lo que permite la integración de datos y las iniciativas de gobernanza.

Según un informe de Gartner, la demanda de catálogos de datos está aumentando a medida que las organizaciones tienen dificultades para encontrar, inventariar y analizar activos de datos distribuidos y diversos. Con un catálogo de datos sólido, las organizaciones pueden localizar y clasificar con mayor facilidad la información a escala, lo que permite una mejor aplicación de las políticas de gobernanza de datos.

Utilizar modelos de madurez

Muchas organizaciones encuentran útil crear una hoja de ruta clara de gobernanza. Los modelos de madurez pueden proporcionar esta hoja de ruta.

Un modelo de madurez de gobernanza de datos es una herramienta que ayuda a las organizaciones a evaluar el estado actual de su programa de gobernanza de datos, establecer objetivos y realizar un seguimiento del progreso a lo largo del tiempo.

Monitorear y mejorar continuamente

Las organizaciones pueden establecer mecanismos regulares de evaluación y presentación de informes para monitorear los datos y las métricas de gobernanza a lo largo del tiempo. Estas evaluaciones pueden ayudar a la organización a identificar problemas y realizar mejoras en los procesos de gobernanza.

Revisar periódicamente el marco y ajustarlo en función del feedback, las nuevas regulaciones o los cambios en la estrategia empresarial ayuda a que el marco siga siendo relevante y eficaz.

Además, las evaluaciones pueden fomentar una cultura que valore los datos como un activo estratégico al permitir la business intelligence y el uso eficaz de los datos en toda la organización.

Autores

Jim Holdsworth

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

David Zax

Staff Writer

IBM Think

Soluciones relacionadas
IBM watsonx.governance

Ponga en funcionamiento una IA confiable monitoreando modelos, gestionando riesgos y aplicando la gobernanza a lo largo de su ciclo de vida de IA.

Explore watsonx.governance
Soluciones de gobernanza de datos

Obtenga el control de sus datos con herramientas de gobernanza que mejoran la calidad, garantizan el cumplimiento y permiten analytics e IA confiables.

Explore las soluciones de gobernanza de datos
Consultoría sobre gobernanza de la IA

Establezca prácticas de IA responsables con orientación de expertos para gestionar el riesgo, cumplir con las regulaciones y poner en funcionamiento una IA confiable a escala.

Explore la consultoría de gobernanza de la IA
Dé el siguiente paso

Dirija, gestione y monitoree su IA a través de una cartera unificada, acelerando resultados responsables, transparentes y explicables.

  1. Explore watsonx.governance
  2. Explorar las soluciones de gobernanza de la IA
Notas de pie de página

1 IDC MarketScape: Worldwide AI Governance Platforms 2023 Vendor Assessment. IDC.  2023. 

2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group de TechTarget, abril 2023. (PDF).

3 Top risk forecast, KPMG, 2024.