Los administradores de datos se encargan de ejecutar programas de administración de datos. Las responsabilidades específicas del administrador de datos incluyen definir métricas de calidad de datos, administrar metadatos y datos de referencia, rastrear el linaje de datos y clasificar datos confidenciales.
Diferentes tecnologías y herramientas pueden respaldar los flujos de trabajo de los administradores de datos, incluida la IA, los catálogos de datos, las bases de datos relacionales , las plataformas de calidad de datos y el software de gobernanza de datos.
Hoy en día, las empresas recopilan y analizan más datos que nunca con la expectativa de desbloquear valiosos insights. Sin embargo, la recopilación de datos y analytics por sí solos no bastan para garantizar resultados satisfactorios. La administración de datos y los administradores de datos pueden apoyar y guiar el uso eficaz de los datos dentro de una cultura basada en datos.
En los últimos años, con la creciente adopción de la IA, la gestión de datos adquirió una importancia adicional. Los sistemas de IA consumen y producen cantidades masivas de datos. La gestión de datos ayuda a garantizar la calidad e integridad de esos datos para que los procesos comerciales impulsados por IA sean efectivos, cumplan con las regulaciones gubernamentales y estén alineados con la gobernanza y los estándares éticos de la IA.
Los buenos programas de administración de datos permiten una curaduría de datos exitosa al mejorar la calidad, la accesibilidad, la usabilidad y la seguridad de los datos. Los administradores de datos ayudan a garantizar que los empleados puedan acceder a datos útiles y precisos del negocio para potenciar la toma de decisiones basada en datos y las ganancias de productividad impulsadas por IA. Los beneficios adicionales de la administración de datos incluyen una interpretación de datos más coherente y una mejor preparación para las auditorías.
Los administradores de datos a menudo colaboran con una gran cantidad de stakeholders, incluidos propietarios de datos, analistas de datos, expertos en ciencia de datos y usuarios comerciales en general, para lograr estos beneficios.
Los empleados que no son reconocidos formalmente como “administradores de datos” pueden, no obstante, tener responsabilidades de administración de datos y dedicar un tiempo significativo a satisfacer las necesidades de datos de sus organizaciones, como inventariarlos y evaluar su calidad. Sin embargo, algunos expertos en gestión de datos afirman que formalizar las funciones de administración de datos es importante, ya que indica que una empresa se toma en serio la gestión de la calidad de los datos.1
La gobernanza y la administración de datos son conceptos separados, pero relacionados. Los programas de gobernanza de datos de las empresas ayudan a garantizar la integridad y la seguridad de los datos a través de políticas, normas y procedimientos para la recopilación, propiedad, almacenamiento, procesamiento y uso de datos. Muchas responsabilidades de administración de datos implican la implementación de reglas descritas en la infraestructura de gobernanza de datos. Como tal, la administración de datos puede considerarse "el aspecto operativo" de la gobernanza de datos.2
Las empresas con programas de administración de datos más maduros pueden tener diferentes tipos de funciones de administrador de datos, que incluyen:
Los casos de uso para la administración de datos incluyen:
La administración de datos suele ser clave para master data management, que es un enfoque para gestionar los datos críticos de una organización a través de tecnología, herramientas y procesos. Las organizaciones emplean gestión de dispositivos móviles (MDM) para crear una única fuente de verdad que integre datos de diversas fuentes, de modo que todos los usuarios de datos trabajen con la misma información.
Las empresas y los administradores de datos a menudo comienzan a implementar una iniciativa de gestión de dispositivos móviles (MDM) en un único dominio de datos (agrupaciones lógicas de datos similares, como datos de clientes o datos de empleados) antes de escalar dicho trabajo en todos los activos de la organización.4
Los administradores de datos pueden mejorar la calidad de los datos revisando el contenido de una base de datos, lo que se conoce como perfilado de datos. También trabajan con los stakeholders de los datos para crear definiciones de datos, diseñar métricas de calidad de datos y establecer business rules para los datos, como qué valores se consideran válidos o no válidos.
Por ejemplo, como se explica en el libro “Data Stewardship”, cuando los datos recopilados son el estado civil de un cliente, una regla podría establecer que “soltero”, “casado”, “viudo” o “divorciado” serían valores válidos, mientras que un respuesta en blanco se consideraría no válida.5 Los administradores de datos también pueden proporcionar una entrada sobre cómo abordar los problemas de calidad de los datos cuando surjan.
Los metadatos son información que describe un punto de datos o conjunto de datos, como la fecha de creación de los datos o los detalles de autoría. Los administradores de datos pueden encargarse de crear metadatos de alta calidad y evaluar la calidad de los metadatos existentes. Al igual que con la calidad general de los datos, los administradores de datos tienen la tarea de abordar los problemas de calidad de los metadatos.
Los administradores de datos a menudo mantienen datos de referencia, que son datos que categorizan otros datos dentro de la empresa. Algunos ejemplos de datos de referencia incluyen códigos de país, información sobre divisas y códigos de productos. A través de la documentación de datos, los administradores de datos pueden registrar valores válidos para datos de referencia, evaluar si son necesarios nuevos valores válidos y conciliar valores de datos de referencia en diferentes sistemas.
En el último caso, utilizando el ejemplo del estado civil, un administrador de datos podría encargarse de determinar qué acciones tomar cuando un sistema permite "viudo" y "divorciado" como datos de estado civil, mientras que otro solo acepta "casado" y "soltero".6
A menudo, varias instancias de datos representan la misma entidad. Considere, por ejemplo, un solo cliente que aparece varias veces en la base de datos de una cadena de farmacias porque tenía diferentes recetas que se surtieron en diferentes almacenes.
A través de un proceso conocido como resolución de identidad, los administradores de datos determinan cuándo diferentes instancias de datos hacen referencia a la misma entidad. En el caso del cliente de una farmacia, por ejemplo, la resolución de identidad puede ayudar a garantizar que se detecten interacciones farmacológicas potencialmente peligrosas al momento de surtir las recetas del cliente.7
Seguridad de la información es la protección de la información importante contra el acceso, la divulgación, el uso, la alteración o la interrupción no autorizados. Según las regulaciones de privacidad de datos, las empresas deben implementar protecciones mejoradas para la información confidencial, como los datos de atención médica. También están obligados a cumplir con las reglas que rigen el intercambio de datos, la limitación de la recopilación de datos y más. Los administradores de datos pueden desempeñar un papel en la protección de datos y el cumplimiento normativo creando y estableciendo clasificaciones de seguridad para diferentes tipos de datos.
El linaje de datos es el proceso de seguimiento de los ciclos de vida de los datos, proporcionando una comprensión clara de dónde se originaron los datos, cómo cambiaron y su destino final. Los administradores de datos pueden rastrear el linaje, lo que ayuda a una organización a afirmar la integridad de los datos para fines de reportes regulatorios.
La mala calidad de los datos puede poner en riesgo los procesos de negocio. Los administradores de datos pueden trabajar con los líderes de procesos de negocio para determinar el uso de datos en un proceso y cuán vulnerable es el proceso a fallas en el caso de una mala calidad de los datos.8
Las organizaciones pueden implementar diversas soluciones y herramientas para respaldar las actividades de gestión de datos, entre ellas:
La IA y la administración de datos tienen lo que algunos podrían considerar una relación simbiótica. Si bien la administración de datos ayuda a garantizar que los sistemas de IA funcionen con datos de alta calidad, las herramientas basadas en IA pueden optimizar las tareas de administración de datos. Por ejemplo, las herramientas de preparación de datos habilitadas para IA pueden realizar comprobaciones de validación y señalar errores, como el formato incorrecto, mientras que las herramientas de prevención de pérdida de datos impulsadas por IA pueden detectar información sensible y aplicar controles de seguridad según sea necesario.
Un catálogo de datos es un inventario de todos los activos de datos de una organización. Está diseñado para ayudar a los administradores de datos y otros profesionales de datos a encontrar información de manera fácil y rápida. Los metadatos asociados con cada activo de datos permiten la capacidad de búsqueda del catálogo.
Las herramientas de perfilado y análisis de datos pueden evaluar la coherencia y la calidad de los datos. Las características de dichas herramientas pueden incluir capacidades para identificar anomalías, validar fuentes de datos y resumir los resultados del análisis a través de informes personalizados.
Una forma en que los administradores de datos organizan los datos es a través de bases de datos relacionales. Una base de datos relacional (RDB) es un tipo de base de datos en la que los datos se organizan en filas y columnas. Las tablas resultantes podrían vincular entre sí para demostrar relaciones entre puntos de datos. Los sistemas de gestión de bases de datos relacionales (RDBMS) son soluciones de software que los administradores de datos y otros pueden emplear para mantener y actualizar las RDB.
Los programas de software de control de datos a menudo incorporan herramientas de análisis y perfiles de datos, así como capacidades impulsadas por IA. Las características pueden incluir el enriquecimiento de metadatos impulsado por IA, la creación de catálogos de datos, el rastreo del linaje de datos y el establecimiento de control de acceso a datos basado en roles.
(Todos los enlaces residen fuera de ibm.com)
1, 4 Allen et al. “Multi-Domain Master Data Management.” Morgan Kaufmann. 10 de abril de 2015.
2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, Second Edition.” Academic Press. 20 de noviembre de 2020.
Diseñe una estrategia de datos que elimine los silos de datos, reduzca la complejidad y mejore la calidad de los datos para ofrecer experiencias excepcionales a clientes y empleados.
watsonx.data le permite escalar los analytics y la IA con todos sus datos, sin importar donde residan, a través de un almacén de datos abierto, híbrido y gobernado.
Desbloquee el valor de los datos empresariales con IBM Consulting, y construya una organización impulsada por insights que ofrezca ventajas empresariales.