Eine Datenarchitektur beschreibt, wie Daten verwaltet werden - von der Erfassung über die Transformationen bis hin zur Verteilung und zum Einsatz Sie gibt den Entwurf für Daten und die Art und Weise vor, wie sie durch Datenspeichersysteme fließen. Sie ist die Grundlage für Datenverarbeitungsvorgänge und Anwendungen der künstlichen Intelligenz (KI).
Der Entwurf einer Datenarchitektur sollte sich an den geschäftlichen Anforderungen orientieren, die Datenarchitekten und Dateningenieure nutzen, um das jeweilige Datenmodell und die zugrunde liegenden Datenstrukturen zu definieren, da diese das Modell unterstützen. Diese Entwürfe erleichtern in der Regel einen geschäftlichen Bedarf, z. B. eine Berichterstattungs- oder Datenwissenschaftsinitiative.
Da durch aufstrebende Technologien wie das Internet der Dinge (IoT) neue Datenquellen entstehen, stellt eine gute Datenarchitektur sicher, dass die Daten verwaltbar und nützlich sind und das Data-Lifecycle-Management unterstützt wird. Sie kann insbesondere redundante Datenspeicherung vermeiden, die Datenqualität durch Bereinigung und Deduplizierung verbessern und neue Anwendungen ermöglichen. Moderne Datenarchitekturen bieten auch Mechanismen zur Integration von Daten über verschiedene Bereiche hinweg, z. B. zwischen Abteilungen oder Regionen. Auf diese Weise werden Datensilos aufgebrochen, ohne dass die Speicherung an einem einzigen Ort zu einer großen Komplexität führt.
Moderne Datenarchitekturen nutzen häufig Cloud-Plattformen zur Verwaltung und Verarbeitung von Daten Obwohl es teurer kommen kann, ermöglicht ihre Skalierbarkeit wichtige Datenverarbeitungsaufgaben in kürzester Zeit zu erledigen. Die Skalierbarkeit des Speichers trägt auch dazu bei, steigende Datenmengen zu bewältigen und sicherzustellen, dass alle relevanten Daten bereitstehen, um die Qualität des Trainings von KI-Anwendungen zu verbessern.
Die Dokumentation der Datenarchitektur umfasst drei Arten von Datenmodellen
Eine Datenarchitektur kann sich auf gängige Unternehmensarchitektur-Frameworks stützen, darunter TOGAF, DAMA-DMBOK 2 und das Zachman Framework for Enterprise Architecture.
The Open Group Architecture Framework (TOGAF)
Diese Methodik der Unternehmensarchitektur wurde in 1995 von The Open Group entwickelt, bei der IBM ein Platinmitglied.
Die Architektur besteht aus vier Säulen:
TOGAF bietet somit ein vollständiges Famework für den Entwurf und die Implementierung der IT-Architektur eines Unternehmens, einschließlich der Datenarchitektur.
DAMA-DMBOK 2
DAMA International, ursprünglich als Data Management Association International gegründet, ist eine gemeinnützige Organisation, die sich für die Förderung des Daten- und Informationsmanagements einsetzt. Ihr Data Management Body of Knowledge, DAMA-DMBOK 2, erstreckt sich auf die Datenarchitektur sowie auf Governance und Ethik, Datenmodellierung und -design, Speicherung, Sicherheit und Integration.
Zachman Framework for Enterprise Architecture
Ursprünglich wurde dieses Framework von John Zachman bei IBM in 1987 entwickelt. Er verwendete eine Matrix aus sechs Ebenen, die von kontextuellen bis hin zu detaillierten Informationen reichen und sechs Fragen wie „Warum“, „Wie“ und „Was“ zugeordnet sind. Es bietet eine formale Möglichkeit, Daten zu organisieren und zu analysieren, sieht aber keine Methoden dafür vor.
Eine Datenarchitektur veranschaulicht aus einer übergeordneten Perspektive, wie verschiedene Datenverwaltungssysteme zusammenarbeiten. Dazu gehören eine Reihe verschiedener Datenspeicher wie Data Lakes, Data Warehouses, Data Marts, Datenbanken und so weiter. Zusammen können sie zu Datenarchitekturen wie Datengewebe und Datennetze führen, die sich immer größerer Beliebtheit erfreuen. Diese Architekturen legen den Schwerpunkt stärker auf Daten als Produkte. Sie sorgen für eine stärkere Standardisierung von Metadaten und eine zunehmende Demokratisierung von Daten in verschiedenen Unternehmen über APIs.
Im folgenden Abschnitt werden die einzelnen Speicherkomponenten und Datenarchitekturtypen näher erläutert:
Arten von Datenverwaltungssystemen
Arten von Datenarchitekturen
Data-Fabric: EineData-Fabric ist eine Architektur, die sich auf die Automatisierung von Datenintegration, Data Engineering und Governance in einer Datenwertschöpfungskette zwischen Datenanbietern und Datenkonsumenten konzentriert. Eine Data-Fabric basiert auf dem Konzept der „aktiven Metadaten“, das Wissensgraphen, Semantik, Data-Mining und die Technologie des maschinellen Lernens (ML) einsetzt, um Muster in verschiedenen Arten von Metadaten (z. B. Systemprotokolle, soziale Daten usw.) zu ermitteln. Im Anschluss daran werden diese Erkenntnisse genutzt, um die Datenwertschöpfungskette zu automatisieren und zu orchestrieren. Ein Datenkonsument kann zum Beispiel ein Datenprodukt finden und dieses dann automatisch bereitgestellt bekommen. Der verbesserte Datenzugriff zwischen Datenprodukten und Datenkonsumenten führt zu einer Verringerung der Datensilos und bietet ein vollständigeres Bild der Unternehmensdaten. Data-Fabrics gehören zu den aufstrebenden Technologien mit enormem Potenzial und können zur Erstellung von Kundenprofilen, zur Betrugserkennung und zur vorbeugenden Wartung eingesetzt werden. Laut Gartner reduzieren Data-Fabrics die Entwicklungszeit für die Integration um 30 %, die Bereitstellungszeit um 30 % und die Wartungszeit um 70 %.
Datennetze: EinDatennetz (Data Mesh) ist eine dezentralisierte Datenarchitektur, die die Daten nach Geschäftsbereichen organisiert. Wenn ein Datennetz verwendet wird, kann ein Unternehmen aufhören, Daten als Nebenprodukt eines Prozesses zu betrachten. Stattdessen kann es beginnen, Daten als eigenständige Produkte zu betrachten. Datenproduzenten agieren als Eigentümer von Datenprodukten. Da die Datenproduzenten Experten auf diesem Gebiet sind, können sie ihr Wissen über die Hauptverbraucher der Daten nutzen, um APIs für diese zu entwickeln. Auf diese APIs kann auch von anderen Teilen des Unternehmens aus zugegriffen werden, so dass ein breiterer Zugriff auf die verwalteten Daten möglich ist.
Tradionionelle Speichersysteme wie Data-Lakes und Data-Warehouses können als multiple, dezentrale Datenspeicher verwendet werden, um ein Datennetz zu realisieren. Ein Datennetz kann auch mit einer Data-Fabric zusammenwirken, wobei die Automatisierung der Data-Fabric die schnellere Erstellung neuer Datenprodukte oder die Durchsetzung einer globalen Governance ermöglicht.
Eine gut konstruierte Datenarchitektur kann Unternehmen eine Reihe von Vorteilen bieten, unter anderem:
Wenn Unternehmen ihre Roadmap für die Anwendungen von morgen erstellen - einschließlich KI, Blockchain und Workloads des Internets der Dinge (IoT) - benötigen sie eine moderne Datenarchitektur, die die Datenanforderungen unterstützen kann.
Die sieben wichtigsten Merkmale einer modernen Datenarchitektur sind:
IBM Cloud Pak for Data ist eine offene, erweiterbare Datenplattform, die ein Data Fabric zur Verfügung stellt, um alle Daten für KI und Analytics in jeder Cloud verfügbar zu machen.
Erstellen Sie KI-Modelle, führen Sie sie aus und verwalten Sie sie. Bereiten Sie Daten vor und erstellen Sie Modelle in jeder beliebigen Cloud mit Open-Source-Code oder visueller Modellierung. Prognostizieren und optimieren Sie Ihre Ergebnisse.
Erfahren Sie mehr über Db2 on Cloud, eine vollständig verwaltete SQL-Cloud-Datenbank, die für eine robuste Leistung konfiguriert und optimiert ist.