Sobre la base de la breve definición anterior, los metadatos son datos que describen un activo de datos o proporcionan información sobre el activo que facilita su localización, evaluación y comprensión.
El ejemplo clásico o más utilizado de metadatos es el catálogo de tarjetas o el catálogo en línea de una biblioteca. En estos, cada tarjeta o lista contiene información sobre un libro o publicación (p. ej., título, autor, tema, fecha de publicación, edición, ubicación dentro de la biblioteca y resumen o sinopsis) que hace que la publicación sea más fácil de encontrar para un lector y también evaluar. Por ejemplo: ¿Es actual o está desactualizado? ¿Tiene la información que estoy buscando? ¿Es el autor alguien en quien confío o cuyo trabajo disfruto?
Hay muchas clases de metadatos, pero un catálogo de datos se ocupa principalmente de tres: metadatos técnicos, metadatos de procesos y metadatos de negocios.
Metadatos técnicos
Metadatos técnicos (también llamado metadatos estructurales) describe cómo se organizan y muestran los datos a los usuarios describiendo la estructura de los objetos de datos, como tablas, columnas, filas, índices y conexiones. Los metadatos técnicos les dicen a los profesionales de datos cómo necesitarán trabajar con los datos, por ejemplo, si pueden trabajar con ellos tal como están o si necesitan transformarlos para su análisis o integración.
Metadatos de proceso
Los metadatos de proceso (también llamados metadatos administrativos) describen las circunstancias de la creación del activo de datos y cuándo, cómo y quién accedió, usó, actualizó o modificó. También debe describir quién tiene permiso para acceder y utilizar los datos.
Los metadatos del proceso proporcionan información sobre el historial del activo y el linaje, lo que puede ayudar a un analista a decidir si el activo es lo suficientemente reciente para la tarea en cuestión, si proviene de una fuente confiable, si ha sido actualizado por personas confiables, etc. Los metadatos del proceso también se pueden usar para solucionar problemas de consultas. Y cada vez más, los metadatos de procesos se extraen para obtener información sobre usuarios o clientes de software, como qué software están usando y el nivel de servicio que están experimentando.
Metadatos empresariales
Los metadatos empresariales (a veces denominados metadatos externos) describen los aspectos comerciales del activo de datos: el valor comercial que tiene para la organización, su idoneidad para un propósito particular o varios propósitos, información sobre la conformidad normativa y más. Los metadatos empresariales son aquellos en los que los profesionales de datos y los usuarios de línea de negocios hablan el mismo idioma sobre los activos de datos.
Como mínimo, un catálogo de datos debería facilitar la búsqueda (o recolección) y la organización de todos los metadatos existentes asociados con cualquier activo de datos en su organización. También debe proporcionar herramientas que permitan a los expertos en datos seleccionar y enriquecer esos metadatos con etiquetas, asociaciones, calificaciones, anotaciones y cualquier otra información y contexto que ayude a los usuarios a encontrar datos más rápido y usarlos con confianza.