¿Qué es la administración de datos?

Dos personas se sientan juntas en un escritorio mirando una pantalla grande de computadora y una tableta.

Autores

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

¿Qué es la administración de datos?

La administración de datos es un conjunto de prácticas de gestión de datos diseñadas para ayudar a garantizar una alta calidad y accesibilidad de los datos. Los programas de administración de datos suelen funcionar en consonancia con las políticas de gobernanza de datos de una organización.
 

Los administradores de datos se encargan de ejecutar programas de administración de datos. Las responsabilidades específicas del administrador de datos incluyen definir métricas de calidad de datos, administrar metadatos y datos de referencia, rastrear el linaje de datos y clasificar datos confidenciales.

Diferentes tecnologías y herramientas pueden respaldar los flujos de trabajo de los administradores de datos, incluida la IA, los catálogos de datos, las bases de datos relacionales , las plataformas de calidad de datos y el software de gobernanza de datos.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

¿Por qué es importante la administración de datos?

Hoy en día, las empresas recopilan y analizan más datos que nunca con la expectativa de desbloquear valiosos insights. Sin embargo, la recopilación de datos y analytics por sí solos no bastan para garantizar resultados satisfactorios. La administración de datos y los administradores de datos pueden apoyar y guiar el uso eficaz de los datos dentro de una cultura basada en datos.

En los últimos años, con la creciente adopción de la IA, la gestión de datos adquirió una importancia adicional. Los sistemas de IA consumen y producen cantidades masivas de datos. La gestión de datos ayuda a garantizar la calidad e integridad de esos datos para que los procesos comerciales impulsados por IA sean efectivos, cumplan con las regulaciones gubernamentales y estén alineados con la gobernanza y los estándares éticos de la IA.

Los buenos programas de administración de datos permiten una curaduría de datos exitosa al mejorar la calidad, la accesibilidad, la usabilidad y la seguridad de los datos. Los administradores de datos ayudan a garantizar que los empleados puedan acceder a datos útiles y precisos del negocio para potenciar la toma de decisiones basada en datos y las ganancias de productividad impulsadas por IA. Los beneficios adicionales de la administración de datos incluyen una interpretación de datos más coherente y una mejor preparación para las auditorías.

Los administradores de datos a menudo colaboran con una gran cantidad de stakeholders, incluidos propietarios de datos, analistas de datos, expertos en ciencia de datos y usuarios comerciales en general, para lograr estos beneficios.

Los empleados que no son reconocidos formalmente como “administradores de datos” pueden, no obstante, tener responsabilidades de administración de datos y dedicar un tiempo significativo a satisfacer las necesidades de datos de sus organizaciones, como inventariarlos y evaluar su calidad. Sin embargo, algunos expertos en gestión de datos afirman que formalizar las funciones de administración de datos es importante, ya que indica que una empresa se toma en serio la gestión de la calidad de los datos.1

Academia de IA

¿Es la gestión de datos el secreto de la IA generativa?

Explore por qué los datos de alta calidad son esenciales para el uso exitoso de la IA generativa.

¿Cuál es la diferencia entre la administración de datos y la gobernanza de datos?

La gobernanza y la administración de datos son conceptos separados, pero relacionados. Los programas de gobernanza de datos de las empresas ayudan a garantizar la integridad y la seguridad de los datos a través de políticas, normas y procedimientos para la recopilación, propiedad, almacenamiento, procesamiento y uso de datos. Muchas responsabilidades de administración de datos implican la implementación de reglas descritas en la infraestructura de gobernanza de datos. Como tal, la administración de datos puede considerarse "el aspecto operativo" de la gobernanza de datos.2

¿Cuáles son los diferentes tipos de administradores de datos?

Las empresas con programas de administración de datos más maduros pueden tener diferentes tipos de funciones de administrador de datos, que incluyen:

  • Administrador de datos empresariales: los administradores de datos empresariales se especializan en la gestión de datos dentro de funciones empresariales específicas, como marketing o atención al cliente.

  • Administrador técnico de datos: como su título sugiere, los administradores técnicos de datos poseen experiencia técnica en procesos y sistemas de datos, incluidos los procesos de extracción, transformación y carga (ETL) y almacenes de datos.

  • Administrador de datos empresariales: lideran comunidades de administradores de datos dentro de las organizaciones y sirven como enlace con otros líderes empresariales.3

¿Cuáles son los casos de uso para la administración de datos?

Los casos de uso para la administración de datos incluyen:

  • Master data management
  • Mejora de la calidad de los datos
  • Gestión de metadatos
  • Gestión de datos de referencia
  • Resolución de identidad
  • Seguridad de la información y protección de la privacidad de datos
  • Seguimiento del linaje de datos
  • Gestión de riesgos de procesos de negocio

Master data management

La administración de datos suele ser clave para master data management, que es un enfoque para gestionar los datos críticos de una organización a través de tecnología, herramientas y procesos. Las organizaciones emplean gestión de dispositivos móviles (MDM) para crear una única fuente de verdad que integre datos de diversas fuentes, de modo que todos los usuarios de datos trabajen con la misma información.

Las empresas y los administradores de datos a menudo comienzan a implementar una iniciativa de gestión de dispositivos móviles (MDM) en un único dominio de datos (agrupaciones lógicas de datos similares, como datos de clientes o datos de empleados) antes de escalar dicho trabajo en todos los activos de la organización.4

Mejora de la calidad de los datos

Los administradores de datos pueden mejorar la calidad de los datos revisando el contenido de una base de datos, lo que se conoce como perfilado de datos. También trabajan con los stakeholders de los datos para crear definiciones de datos, diseñar métricas de calidad de datos y establecer business rules para los datos, como qué valores se consideran válidos o no válidos.

Por ejemplo, como se explica en el libro “Data Stewardship”, cuando los datos recopilados son el estado civil de un cliente, una regla podría establecer que “soltero”, “casado”, “viudo” o “divorciado” serían valores válidos, mientras que un respuesta en blanco se consideraría no válida.5 Los administradores de datos también pueden proporcionar una entrada sobre cómo abordar los problemas de calidad de los datos cuando surjan.

Gestión de metadatos

Los metadatos son información que describe un punto de datos o conjunto de datos, como la fecha de creación de los datos o los detalles de autoría. Los administradores de datos pueden encargarse de crear metadatos de alta calidad y evaluar la calidad de los metadatos existentes. Al igual que con la calidad general de los datos, los administradores de datos tienen la tarea de abordar los problemas de calidad de los metadatos.

Gestión de datos de referencia

Los administradores de datos a menudo mantienen datos de referencia, que son datos que categorizan otros datos dentro de la empresa. Algunos ejemplos de datos de referencia incluyen códigos de país, información sobre divisas y códigos de productos. A través de la documentación de datos, los administradores de datos pueden registrar valores válidos para datos de referencia, evaluar si son necesarios nuevos valores válidos y conciliar valores de datos de referencia en diferentes sistemas.

En el último caso, utilizando el ejemplo del estado civil, un administrador de datos podría encargarse de determinar qué acciones tomar cuando un sistema permite "viudo" y "divorciado" como datos de estado civil, mientras que otro solo acepta "casado" y "soltero".6

Resolución de identidad

A menudo, varias instancias de datos representan la misma entidad. Considere, por ejemplo, un solo cliente que aparece varias veces en la base de datos de una cadena de farmacias porque tenía diferentes recetas que se surtieron en diferentes almacenes.

A través de un proceso conocido como resolución de identidad, los administradores de datos determinan cuándo diferentes instancias de datos hacen referencia a la misma entidad. En el caso del cliente de una farmacia, por ejemplo, la resolución de identidad puede ayudar a garantizar que se detecten interacciones farmacológicas potencialmente peligrosas al momento de surtir las recetas del cliente.7

Seguridad de la información y protección de la privacidad de datos

Seguridad de la información es la protección de la información importante contra el acceso, la divulgación, el uso, la alteración o la interrupción no autorizados. Según las regulaciones de privacidad de datos, las empresas deben implementar protecciones mejoradas para la información confidencial, como los datos de atención médica. También están obligados a cumplir con las reglas que rigen el intercambio de datos, la limitación de la recopilación de datos y más. Los administradores de datos pueden desempeñar un papel en la protección de datos y el cumplimiento normativo creando y estableciendo clasificaciones de seguridad para diferentes tipos de datos.

Seguimiento del linaje de datos

El linaje de datos es el proceso de seguimiento de los ciclos de vida de los datos, proporcionando una comprensión clara de dónde se originaron los datos, cómo cambiaron y su destino final. Los administradores de datos pueden rastrear el linaje, lo que ayuda a una organización a afirmar la integridad de los datos para fines de reportes regulatorios.

Gestión de riesgos de procesos de negocio

La mala calidad de los datos puede poner en riesgo los procesos de negocio. Los administradores de datos pueden trabajar con los líderes de procesos de negocio para determinar el uso de datos en un proceso y cuán vulnerable es el proceso a fallas en el caso de una mala calidad de los datos.8

¿Qué tecnologías y herramientas respaldan la administración de datos?

Las organizaciones pueden implementar diversas soluciones y herramientas para respaldar las actividades de gestión de datos, entre ellas:

  • Inteligencia Artificial (IA)
  • Catálogos de datos
  • Herramientas de perfilado y análisis de datos
  • Sistemas de gestión de bases de datos relacionales (RDBMS)
  • Software de gobernanza de datos

Inteligencia artificial

La IA y la administración de datos tienen lo que algunos podrían considerar una relación simbiótica. Si bien la administración de datos ayuda a garantizar que los sistemas de IA funcionen con datos de alta calidad, las herramientas basadas en IA pueden optimizar las tareas de administración de datos. Por ejemplo, las herramientas de preparación de datos habilitadas para IA pueden realizar comprobaciones de validación y señalar errores, como el formato incorrecto, mientras que las herramientas de prevención de pérdida de datos impulsadas por IA pueden detectar información sensible y aplicar controles de seguridad según sea necesario.

Catálogos de datos

Un catálogo de datos es un inventario de todos los activos de datos de una organización. Está diseñado para ayudar a los administradores de datos y otros profesionales de datos a encontrar información de manera fácil y rápida. Los metadatos asociados con cada activo de datos permiten la capacidad de búsqueda del catálogo.

Herramientas de perfilado y análisis de datos

Las herramientas de perfilado y análisis de datos pueden evaluar la coherencia y la calidad de los datos. Las características de dichas herramientas pueden incluir capacidades para identificar anomalías, validar fuentes de datos y resumir los resultados del análisis a través de informes personalizados.

Sistemas de gestión de bases de datos relacionales

Una forma en que los administradores de datos organizan los datos es a través de bases de datos relacionales. Una base de datos relacional (RDB) es un tipo de base de datos en la que los datos se organizan en filas y columnas. Las tablas resultantes podrían vincular entre sí para demostrar relaciones entre puntos de datos. Los sistemas de gestión de bases de datos relacionales (RDBMS) son soluciones de software que los administradores de datos y otros pueden emplear para mantener y actualizar las RDB.

Software de gobernanza de datos

Los programas de software de control de datos a menudo incorporan herramientas de análisis y perfiles de datos, así como capacidades impulsadas por IA. Las características pueden incluir el enriquecimiento de metadatos impulsado por IA, la creación de catálogos de datos, el rastreo del linaje de datos y el establecimiento de control de acceso a datos basado en roles.

Notas de pie de página

(Todos los enlaces residen fuera de ibm.com)

1, 4 Allen et al. “Multi-Domain Master Data Management.” Morgan Kaufmann. 10 de abril de 2015.

2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, Second Edition.” Academic Press. 20 de noviembre de 2020.

Soluciones relacionadas
Software y soluciones de gestión de datos

Diseñe una estrategia de datos que elimine los silos de datos, reduzca la complejidad y mejore la calidad de los datos para ofrecer experiencias excepcionales a clientes y empleados.

Explore las soluciones de gestión de datos
IBM watsonx.data™

watsonx.data le permite escalar los analytics y la IA con todos sus datos, sin importar donde residan, a través de un almacén de datos abierto, híbrido y gobernado.

Descubra watsonx.data
Servicios de consultoría en datos y analytics

Desbloquee el valor de los datos empresariales con IBM Consulting, y construya una organización impulsada por insights que ofrezca ventajas empresariales.

Descubra los servicios de analytics
Dé el siguiente paso

Diseñe una estrategia de datos que elimine los silos de datos, reduzca la complejidad y mejore la calidad de los datos para ofrecer experiencias excepcionales a clientes y empleados.

Explore las soluciones de gestión de datos Descubra watsonx.data