Les métadonnées sont des données qui décrivent un actif de données ou fournissent des informations sur l'actif qui facilitent la localisation, l'évaluation et la compréhension.
L'exemple type ou le plus couramment utilisé de métadonnées est le catalogue sur fiches ou le catalogue en ligne d'une bibliothèque. Dans celles-ci, chaque carte ou liste contient des informations sur un livre ou une publication (par exemple, titre, auteur, sujet, date de publication, édition, emplacement dans la bibliothèque et résumé ou synopsis) qui facilite la localisation ou l'évaluation de ce livre ou de cette publication pour un lecteur. Par exemple : est-il actuel ou obsolète ? Contient-il les informations que je recherche ? L'auteur est-il quelqu'un en qui j'ai confiance ou dont j'apprécie le travail ?
Il existe de nombreuses classes de métadonnées, mais un catalogue de données en traite principalement trois : les métadonnées techniques, les métadonnées de processus et les et les métadonnées métier.
Métadonnées techniques
Les métadonnées techniques (également appelées métadonnées structurelles) décrivent la manière dont les données sont organisées et présentées aux utilisateurs en décrivant la structure des objets de données, comme les tableaux, les colonnes, les lignes, les index et les connexions. Les métadonnées techniques indiquent aux professionnels des données comment ils devront travailler avec les données, par exemple, s'ils peuvent les utiliser telles quelles ou s'ils doivent les transformer à des fins d'analyse ou d'intégration.
Métadonnées de processus
Les métadonnées de processus (également appelées métadonnées administratives) décrivent les circonstances de la création de l'actif de données et quand, comment et par qui il a été consulté, utilisé, mis à jour ou modifié. Elles doivent également décrire qui est autorisé à accéder aux données et à les utiliser.
Les métadonnées de processus fournissent des informations sur l'historique et le lignagede l'actif. Ces informations sont utiles pour un analyste qui peut alors décider si l'actif est suffisamment récent pour la tâche à accomplir, s'il provient d'une source fiable, s'il a été mis à jour par des personnes dignes de confiance, etc. Les métadonnées de processus peuvent également être utilisées pour résoudre les requêtes. Et de plus en plus, les métadonnées de processus sont exploitées pour obtenir des informations sur les utilisateurs de logiciels ou les clients, tels que les logiciels qu'ils utilisent et le niveau de service dont ils bénéficient.
Métadonnées métier
Les métadonnées métier (parfois appelées métadonnées externes) décrivent les aspects métier de l'actif de données : la valeur métier qu'il a pour l'organisation, son adéquation à un objectif particulier ou à diverses fins, des informations sur la conformité réglementaire, etc. Les métadonnées métier unissent les professionnels des données et les utilisateurs du secteur qui parlent le même langage à propos des actifs de données.
Un catalogue de données doit au minimum faciliter la recherche (ou la collecte) et l'organisation de toutes les métadonnées existantes associées à n'importe quel actif de données de votre organisation. Il devrait également fournir des outils permettant aux experts en données de conserver et d'enrichir ces métadonnées avec des étiquettes, des associations, des évaluations, des annotations et toute autre information et contexte qui aident les utilisateurs à trouver des données plus rapidement et à les utiliser en toute confiance.