Zusätzlich zu den fünf grundlegenden Schichten gehören zu den weiteren in einem modernen Datenstack üblichen Schichten:
Datenerkennung
Unzugängliche Daten sind nutzlose Daten. Die Datenerkennung trägt dazu bei, dass Daten nicht einfach außer Sichtweite bleiben. Konkret geht es bei der Datenerkennung um das Sammeln, Auswerten und Untersuchen von Daten aus unterschiedlichen und voneinander unabhängigen Quellen, mit dem Ziel, Daten aus isolierten oder bisher unbekannten Quellen für die Analyse zusammenzuführen.
Data Governance
Bei moderne Datenplattformen liegt der Schwerpunkt häufig auf der Data-Governance und Datensicherheit, um sensible Informationen zu schützen, die Einhaltung von Vorschriften voranzutreiben, den Zugriff zu erleichtern und die Datenqualität zu verwalten. Zu den Tools, die diese Ebene unterstützen, gehören Zugriffskontrollen, Verschlüsselung, Auditing und Datenabstammung.
Datenkatalogisierung und Metadatenmanagement
Datenkataloge verwenden Metadaten – Daten, die Daten beschreiben oder zusammenfassen –, um ein informatives und durchsuchbares Inventar aller Daten-Assets in einem Unternehmen zu erstellen. Zum Beispiel kann ein Datenkatalog Menschen helfen, unstrukturierte Daten, einschließlich Dokumente, Bilder, Audio-, Video- und Datenvisualisierung, schneller zu finden.
Maschinelles Lernen und KI
Einige Datenplattformen, die für Unternehmen entwickelt wurden, bieten maschinelles Lernen und KI-Funktionen, damit Benutzer wertvolle Erkenntnisse aus Daten gewinnen können. Zum Beispiel könnten Plattformen vorausschauende Analysealgorithmen, Modelle für maschinelles Lernen zur Anomalie-Erkennung und automatisierte Erkenntnisse, die auf generativen KI-Tools basieren, bieten.