Startseite topics Was ist Data Fabric? Was ist eine Datenstruktur?
Erfahren Sie, wie Datenstrukturen die Daten intelligent über eine verteilte Umgebung hinweg orchestrieren und sie für Datennutzer bereitstellen
Ansicht von oben auf einen Computerprogrammierer, der am Schreibtisch arbeitet
Was ist eine Datenstruktur?

Datenstrukturen sind eine Architektur, die die End-to-End-Integration verschiedener Datenpipelines und Cloud-Umgebungen durch den Einsatz intelligenter und automatisierter Systeme erleichtert. Im letzten Jahrzehnt haben Entwicklungen in den Bereichen Hybrid Cloud, künstliche Intelligenz, Internet der Dinge (IoT) und Edge-Computing zu einer exponentiellen Zunahme von Big Data geführt, sodass Unternehmen mit noch höherer Komplexität konfrontiert sind. Die Vereinheitlichung und Verwaltung von Datenumgebungen hat daher immer mehr an Priorität gewonnen, da dieses Wachstum zu erheblichen Herausforderungen wie Datensilos, Sicherheitsrisiken und allgemeinen Engpässen bei der Entscheidungsfindung geführt hat. Datenmanagement-Teams gehen diese Herausforderungen direkt mit Datenstrukturlösungen an. Sie nutzen sie, um ihre unterschiedlichen Datensysteme zu vereinheitlichen, Governance einzubetten, Sicherheits- und Datenschutzmaßnahmen zu stärken und Mitarbeitern, insbesondere ihren geschäftlichen Nutzern, mehr Datenzugriff zu bieten.

Diese Bemühungen zur Datenintegration mittels Datenstrukturen ermöglichen eine ganzheitlichere, datenzentrierte Entscheidungsfindung. In der Vergangenheit hatte ein Unternehmen möglicherweise unterschiedliche Datenplattformen, die auf bestimmte Geschäftsbereiche ausgerichtet waren. Sie haben beispielsweise jeweils eine Plattform für HR, Lieferkette und Kundendaten, die die Daten trotz möglicher Überschneidungen in unterschiedlichen und separaten Umgebungen speichern. Mit einer Datenstruktur können Entscheidungsträger diese Daten jedoch im Zusammenhang betrachten, um den Kundenlebenszyklus besser zu verstehen und Verbindungen zwischen Daten herzustellen, die vorher nicht existierten. Indem sie diese Lücken im Verständnis von Kunden, Produkten und Prozessen schließen, beschleunigen Datenstrukturen die digitale Transformation und Automatisierungsinitiativen in Unternehmen.

Datenstruktur vs. Data Virtualization

Data Virtualization ist eine der Technologien, die einen Datenstrukturansatz ermöglichen. Anstatt die Daten aus verschiedenen lokalen und Cloud-Quellen mit den üblichen ETL-Prozessen (Extrahieren, Transformieren, Laden) physisch zu verschieben, stellt ein Data Virtualization-Tool eine Verbindung zu den verschiedenen Quellen her, integriert nur die erforderlichen Metadaten und erstellt eine virtuelle Datenschicht. Dadurch können Benutzer die Quelldaten in Echtzeit nutzen.

Ein führender Anbieter bei der Bereitstellung hochwertiger Daten

Erfahren Sie, warum IBM im Gartner Magic Quadrant 2024 als ein führender Anbieter im Bereich der Datenqualitätslösungen ausgezeichnet wurde.

Datenstruktur-Architektur

Durch die Nutzung von Datenservices und APIs führen Datenstrukturen die Daten aus Altsystemen, Data Lakes, Data Warehouses, SQL-Datenbanken und Anwendungen zusammen und bieten damit eine ganzheitliche Übersicht der betrieblichen Leistung. Im Gegensatz zu diesen individuellen Datenspeichersystemen zielt sie darauf ab, eine größere Fluidität zwischen Datenumgebungen zu schaffen und dem Problem der Datengravitation entgegenzuwirken, d. h. der Vorstellung, dass es immer schwieriger wird, Daten zu bewegen, je größer sie werden. Eine Datenstruktur abstrahiert die technologische Komplexität, die mit der Datenbewegung, -umwandlung und -integration verbunden ist, und macht alle Daten unternehmensweit verfügbar.

Datenstruktur-Architekturen basieren auf der Idee, Daten in Plattformen mit Anwendungen, die sie benötigen, zu koppeln. Ein Beispiel für eine Datenstruktur-Architektur in einer Multi-Cloud-Umgebung könnte wie folgt aussehen: Eine Cloud wie AWS verwaltet die Datenaufnahme, während eine andere Plattform wie Azure für die Datenumwandlung und -nutzung zuständig ist. Dann könnte ein dritter Anbieter, wie IBM Cloud Pak® for Data, Analysedienste bereitstellen. Die Datenstruktur-Architektur fügt diese Umgebungen zusammen, um eine einheitliche Datenansicht zu erstellen.

Dies ist jedoch nur ein Beispiel. Es gibt keine einheitliche Datenarchitektur für eine Datenstruktur, da verschiedene Unternehmen unterschiedliche Anforderungen haben. Die große Anzahl von Cloud-Anbietern und Dateninfrastruktur-Implementierungen sorgt für Unterschiede zwischen den Unternehmen. Unternehmen, die diese Art von Daten-Framework nutzen, weisen jedoch Gemeinsamkeiten in ihren Architekturen auf, die für eine Datenstruktur einzigartig sind. Genauer gesagt bestehen sie aus sechs grundlegenden Komponenten, die Forrester (Link befindet sich außerhalb von ibm.com) in dem Bericht „Enterprise Data Fabric Enables DataOps" beschreibt. Diese sechs Komponenten umfassen Folgendes:

  1. Datenverwaltungskomponente: Diese ist für die Datenverwaltung und Datensicherheit verantwortlich.
  2. Datenaufnahmekomponente: Diese fügt die Cloud-Daten zusammen und findet Verbindungen zwischen strukturierten und unstrukturierten Daten.
  3. Datenverarbeitung: Die Datenverarbeitungskomponente verfeinert die Daten, um sicherzustellen, dass nur relevante Daten für die Datenextraktion angezeigt werden.
  4. Datenorchestrierung: Diese kritische Komponente führt einige der wichtigsten Aufgaben für die Datenstruktur aus – die Transformation, Integration und Bereinigung der Daten, um sie für Teams im gesamten Unternehmen nutzbar zu machen.
  5. Data Discovery: Diese Komponente eröffnet neue Möglichkeiten zur Integration unterschiedlicher Datenquellen. So können beispielsweise Daten in einem Data Mart für die Lieferkette und einem Datensystem für das Kundenbeziehungsmanagement miteinander verknüpft werden, was neue Möglichkeiten für Produktangebote an Kunden oder für die Verbesserung der Kundenzufriedenheit eröffnet.
  6. Datenzugriff: Diese Komponente ermöglicht die Nutzung von Daten und stellt sicher, dass bestimmte Teams die richtigen Berechtigungen erhalten, um behördliche Vorschriften einzuhalten. Darüber hinaus hilft diese Komponente dabei, relevante Daten durch die Verwendung von Dashboards und anderen Data Virtualization-Tools sichtbar zu machen. 
Vorteile von Datenstruktur-Architekturen

Gartner (Link befindet sich außerhalb von ibm.com) hat festgestellt, dass die Anbieter von Data Fabric immer mehr Akzeptanz bei den Unternehmen auf dem Markt finden, und weist darauf hin, dass „die Zeit für das Integrationsdesign um 30 %, die Bereitstellung um 30 % und die Wartung um 70 % reduziert werden kann." Es liegt auf der Hand, dass Datenstrukturen die Gesamtproduktivität verbessern können, aber auch die folgenden Vorteile haben den Anwendern einen geschäftlichen Nutzen beschert:

  • Intelligente Integration: Datenstrukturen nutzen semantische Wissensdiagramme, Metadatenverwaltung und maschinelles Lernen, um Daten über verschiedene Datentypen und Endpunkte hinweg zu vereinheitlichen. Dies hilft den Datenverwaltungsteams bei der Gruppierung verwandter Datensätze sowie bei der Integration neuer Datenquellen in das Datenökosystem eines Unternehmens. Diese Funktionalität automatisiert Aspekte des Daten-Workload-Managements, was zu den bereits erwähnten Effizienzsteigerungen führt, aber auch dazu beiträgt, Silos zwischen Datensystemen zu beseitigen, Data-Governance-Praktiken zu zentralisieren und die Datenqualität insgesamt zu verbessern.
  • Demokratisierung von Daten: Datenstruktur-Architekturen erleichtern Self-Service-Anwendungen und erweitern den Zugang zu Daten über die eher technischen Ressourcen hinaus, z. B. Dateningenieure, Entwickler und Datenanalyseteams. Die Verringerung von Datenengpässen führt zu einer höheren Produktivität, da die geschäftlichen Nutzer schnellere Geschäftsentscheidungen treffen können und die technischen Nutzer die Möglichkeit haben, Aufgaben zu priorisieren, bei denen ihre Fähigkeiten besser genutzt werden.
  • Besserer Datenschutz: Die Ausweitung des Datenzugriffs bedeutet auch keine Kompromisse hinsichtlich der Datensicherheit und Datenschutzmaßnahmen einzugehen. Tatsächlich bedeutet dies, dass mehr Data-Governance-Leitplanken für die Zugriffskontrolle eingerichtet werden, um sicherzustellen, dass bestimmte Daten nur für bestimmte Rollen verfügbar sind. Datenstruktur-Architekturen ermöglichen es Technik- und Sicherheitsteams, Datenmaskierung und Verschlüsselung für sensible und geschützte Daten zu implementieren und so die Risiken im Zusammenhang mit der gemeinsamen Nutzung von Daten und Systemverletzungen zu minimieren. 
Anwendungsfälle von Datenstrukturen

Datenstrukturen stecken noch in den Kinderschuhen, aber ihre Datenintegrationsfunktionen unterstützen Unternehmen bei der Datenermittlung und ermöglichen ihnen eine Vielzahl von Anwendungsfällen. Auch wenn sich die Anwendungsfälle, die eine Datenstruktur verarbeiten kann, nicht wesentlich von anderen Datenprodukten unterscheiden, so unterscheidet sie sich doch durch den Umfang und die Größenordnung, die sie verarbeiten kann, da sie Datensilos beseitigt. Durch die Integration verschiedener Datenquellen können Unternehmen und ihre Data Scientists eine ganzheitliche Sicht auf ihre Kunden erstellen, was sich insbesondere bei Bankkunden als hilfreich erwiesen hat. Datenstrukturen wurden insbesondere für Folgendes verwendet:

  • Kundenprofile,
  • Betrugsaufdeckung,
  • Präventive Wartungsanalyse,
  • Risikomodelle für die Rückkehr an den Arbeitsplatz und mehr.
Zugehörige Lösungen
IBM Cloud Pak for Data

IBM Cloud Pak for Data ist eine offene, erweiterbare Datenplattform, die eine Datenstruktur bietet, um alle Daten für KI und Analysen in jeder Cloud verfügbar zu machen.

IBM Cloud Pak for Data kennenlernen
IBM Watson® Studio

Erstellen Sie KI-Modelle, führen Sie sie aus und verwalten Sie sie. Bereiten Sie Daten auf und erstellen Sie Modelle in jeder Cloud mit Open-Source-Code oder visueller Modellierung. Prognostizieren und optimieren Sie Ihre Ergebnisse.

Entdecken Sie IBM Watson Studio
IBM® Db2 in der Cloud

Erfahren Sie mehr über Db2 on Cloud, eine vollständig verwaltete SQL-Cloud-Datenbank, die für robuste Leistung konfiguriert und optimiert ist.

Entdecken Sie IBM Db2 on Cloud
Ressourcen Eine Blaupause für Daten in einer Multi-Cloud-Welt

Lesen Sie den Bericht darüber, wie Ihr Unternehmen über die Datenbank hinausgehen und eine Datenstruktur schaffen kann, in der die richtigen Daten am richtigen Ort und in der richtigen Anwendung zur richtigen Zeit zur Verfügung stehen.

Schaffen Sie eine starke Datengrundlage für KI

Lesen Sie das Smartpaper darüber, wie Sie eine solide Datengrundlage für KI schaffen, indem Sie sich auf drei Schlüsselbereiche der Datenverwaltung konzentrieren: Zugriff, Governance sowie Datenschutz und Compliance.

Die Zukunft der Datenstruktur

Hören Sie sich dieses Webinar an, in dem IBM und Gartner die Zukunft und Bedeutung der Datenstruktur und deren Kernkomponenten diskutieren.

State Bank of India

Erfahren Sie, wie die State Bank of India (Staatsbank von Indien) mehrere IBM-Lösungen zusammen mit der IBM® Garage-Methode verwendet hat, um eine umfassende Online-Banking-Plattform zu entwickeln.

Einbinden eines Datengewebes in eine hybride Multi-Cloud

Ein Datengewebe (Data Fabric) kann Unternehmen dabei helfen, in KI, maschinelles Lernen, Internet der Dinge und Edge-Computing zu investieren, um mehr Wert aus ihren Daten zu erhalten.

Nächste Schritte
Datenstrukturen und IBM Cloud Pak for Data

IBM Cloud Pak® for Data nutzt Microservices und seine führenden Daten- und KI-Funktionen, um die intelligente Integration von Daten über verteilte Systeme hinweg zu ermöglichen und Unternehmen eine ganzheitliche Sicht auf die Geschäftsleistung zu bieten. Dies erleichtert eine schnellere Erfassung, Organisation und Einsicht in Unternehmensdaten und ermöglicht es Unternehmen, die passenden Entscheidungen zu treffen. Datenmanagement-Teams können sich auch darauf verlassen, dass ihre Daten mit den wettbewerbsfähigen Sicherheitsframeworks von IBM sicher sind, wodurch die Einhaltung gesetzlicher Richtlinien sichergestellt und Compliance-Risiken reduziert werden.

Erfahren Sie, wie IBM Cloud Pak® for Data die Data Governance-Praktiken Ihres Unternehmens in Multi-Cloud-Umgebungen verbessern kann.