Mein IBM Anmelden Abonnieren

Startseite

Think

Themen

Gemeinsame Datennutzung

Was ist gemeinsame Datennutzung?

Was ist gemeinsame Datennutzung?

Entdecken Sie IBM's Data Product Hub Abonnieren Sie KI-Updates
Illustration zur Darstellung des Datenflusses in die Wolken

Veröffentlicht: 30. August 2024
Mitwirkender: Tim Mucci

Was ist gemeinsame Datennutzung?

Was ist gemeinsame Datennutzung?

Bei der gemeinsamen Datennutzung werden die Datenressourcen eines Unternehmens mehreren Anwendungen, Benutzern und anderen Unternehmen zur Verfügung gestellt. Eine effektive gemeinsame Datennutzung erfordert eine Kombination aus Technologien, Verfahren, rechtlichen Frameworks und organisatorischen Maßnahmen, um mehreren Einheiten einen sicheren Zugriff zu ermöglichen, ohne die Datenintegrität zu gefährden.

Unternehmen, die sich mit Big Data Analytics befassen, betrachten Daten als wertvolles strategisches Asset in ihrem Portfolio. Diese Daten stammen aus verschiedenen Quellen, wie z. B. aus Softwareanwendungen abgeleitete Metriken, Daten zum Kundenverhalten und Signale von Geräten und Sensoren aus dem Internet der Dinge (IoT).

Stellen Sie sich Daten als Bücher in einer Bibliothek vor. Die gemeinsame Datennutzung ist vergleichbar mit einem Bibliotheksausweis, der es jedem im Unternehmen ermöglicht, bei Bedarf auf diese Bücher zuzugreifen und sie auszuleihen. Ohne die gemeinsame Datennutzung müsste jede Abteilung ihre eigene Bibliothek erstellen und pflegen, was zu Doppelarbeit, veralteten Informationen und begrenzten Ressourcen führen würde.

Unternehmen, die Daten austauschen, können effektiver mit Partnern zusammenarbeiten, neue Geschäftsmöglichkeiten schaffen, neue Partnerschaften eingehen und durch Datenprodukte und andere Monetarisierungsmöglichkeiten Einnahmequellen generieren. Die gemeinsame Datennutzung erfordert jedoch die Verpflichtung, die Integrität und Zuverlässigkeit der gemeinsam genutzten Daten während ihres gesamten Lebenszyklus zu wahren und sicherzustellen, dass sie vertrauenswürdig, kohärent und für eine genaue Analyse nützlich bleiben. Durch die erfolgreiche gemeinsame Datennutzung können Stakeholder wertvolle Perspektiven gewinnen, neue Dienstleistungen und Technologien entwickeln und sich auf kommende Trends vorbereiten, indem sie große Datenmengen sowohl innerhalb als auch außerhalb des Unternehmens analysieren.

IBM's Leitfaden für Datenverantwortliche erkunden

Der Leitfaden für Datenverantwortliche veranschaulicht, wie sich einzelne Datenbanktypen für die Anforderungen eines Unternehmens eignen, je nachdem, ob es den Schwerpunkt auf Analysen, KI oder Anwendungsleistung legt.

Ähnliche Inhalte Erfahren Sie, wie ein Plan zur Datenverwaltung zum Schutz sensibler Informationen beiträgt Daten als Produkt bieten einen strukturierten Ansatz zur Verwaltung des Wertes von Daten.
Der Wert des Datenaustauschs für ein Unternehmen

Der Wert des Datenaustauschs für ein Unternehmen

Unternehmen haben schon lange vor der Erfindung des Internets Daten ausgetauscht, aber Fortschritte in den Bereichen digitale Kompetenz, Technologie und Cloud-Nutzung haben zu einem Echtzeit-Datenaustausch auf globaler Ebene geführt. Technologien für Datenspeicher und -übertragung sind verfügbarer und erschwinglicher als je zuvor. Daher wurden Richtlinien und Vorschriften entwickelt, um die mit der gemeinsamen Nutzung von Daten verbundenen Risiken zu verringern. Die gemeinsame Datennutzung bedeutet mehr als nur den Zugang für Analysen und die Monetarisierung zu ermöglichen. Sie baut auch Barrieren zwischen Geschäftseinheiten und externen Partnern ab. Verschiedene Teams können unabhängig voneinander oder miteinander arbeiten und dabei auf dieselbe aktuelle Datenquelle zugreifen. Die größere Menge und Vielfalt der verfügbaren Daten ermöglicht es verschiedenen Teams im gesamten Unternehmen, zu den übergeordneten Zielen des Unternehmens beizutragen.

Die Kombination von Informationen aus verschiedenen Quellen, wie z. B. Forschungsdaten, Betriebsdaten oder Kundenfeedback, verbessert die Serviceleistung und erhöht den Wert dieser Dienstleistungen. Unternehmensbereiche mit Zugriff auf Daten können beispielsweise mithilfe von Datenanalysen auf der Grundlage von Markttrends und Kundenpräferenzen erfolgreiche Marketingstrategien entwickeln.

Darüber hinaus ermöglicht die gemeinsame Datennutzung Behörden und Unternehmen, ihre Daten auf sichere, rechtmäßige und kontrollierte Weise auszutauschen. Ein wesentlicher Bestandteil der Datensicherheitsmaßnahmen besteht darin, dass die Datenproduzenten die Datensätze sorgfältig dokumentieren und mit genauen Metadaten versehen, um die Reproduzierbarkeit zu unterstützen. Detaillierte Beschreibungen mit klaren Definitionen stellen sicher, dass andere die geteilten Daten leicht finden, entdecken und verstehen können.

Das Future of Privacy Forum1 (FPF) hat Partnerschaften zwischen Unternehmen und akademischen Forschern im Bereich des Datenaustauschs analysiert und festgestellt, dass diese Partnerschaften die gesellschaftlich nützliche Forschung beschleunigen, den Zugang zu wertvollen Datensätzen erweitern und die Reproduzierbarkeit von Forschungsergebnissen verbessern können. Da der Datenaustausch immer weiter verbreitet ist, ergreifen die Stakeholder proaktive Maßnahmen, um Risiken und Datenschutzverletzungen durch die Verwendung von Vereinbarungen zum Datenaustausch (Data Sharing Agreements, DSAs) und Technologien zur Verbesserung des Datenschutzes (Privacy Enhancing Technologies, PETs) zu begegnen.

IBM ist ein gutes Beispiel für die Anwendung strenger Datenschutz- und Sicherheitsprotokolle bei der gemeinsamen Nutzung von Daten, einschließlich der Verwendung von PETs zur Anonymisierung von Daten vor der Weitergabe an Universitäten, gemeinnützige Organisationen und Forschungslabors. Der Ansatz von IBM unterstützt wissenschaftliche Entdeckungen und schützt gleichzeitig sensible Daten, wodurch sicherere und effektivere Partnerschaften gefördert werden. IBM hat beispielsweise mit Melbourne Water in Australien zusammengearbeitet, um Daten zur Reduzierung von Energieemissionen zu analysieren. Während der COVID-19-Pandemie verarbeitete IBM SARS-CoV-2-Genomsequenzen und trug über 3 Millionen Sequenzen zu einem Forschungsarchiv bei.

Ein weiteres überzeugendes Beispiel für den Wert des Datenaustauschs kommt von der gemeinnützigen Organisation „Benefits Data Trust“ aus den USA.2 Benefits Data Trust (BDT) fördert den Datenaustausch zwischen den Bundesstaaten und Unternehmen, die im Gesundheits- und Bildungswesen der USA tätig sind. Durch Vereinbarungen zur gemeinsamen Datennutzung fördert BDT die Einschreibung in entscheidende öffentliche Programme wie das Supplemental Nutrition Assistance Program (SNAP) und Medicaid.

Das Department of Social Services von South Carolina verglich zusammen mit BDT monatliche Medicaid- und SNAP-Listen, in denen sie berechtigte Personen identifizierten, die nicht im Programm registriert waren. Diese Initiative hat seit 2015 zu über 20.000 weiteren SNAP-Anmeldungen geführt und den Zugang zu Ernährungshilfe für gefährdete Bevölkerungsgruppen verbessert. Ähnliche Bemühungen in Pennsylvania waren ebenfalls erfolgreich: Durch den Datenaustausch konnten seit 2005 etwa 240.000 Menschen in verschiedene öffentliche Hilfsprogramme aufgenommen werden.

Die Risiken, die mit der gemeinsamen Datennutzung verbunden sind

Die Risiken, die mit der gemeinsamen Datennutzung verbunden sind

Die gemeinsame Nutzung von Daten bietet Unternehmen zwar viele Vorteile, birgt aber auch Risiken. Wenn sensible Informationen nicht ordnungsgemäß weitergegeben werden, kann dies für ein Unternehmen zu regulatorischen, wettbewerbsbezogenen, finanziellen und sicherheitsrelevanten Risiken führen. Datennutzer haben nur begrenzte Kontrolle über die Qualität und Verfügbarkeit von Daten. Daten von geringer Qualität können auch versteckte Vorurteile gegenüber Geschlechtern, Rassen, Religionen oder ethnischen Gruppen enthalten.

Data-Governance-Prozesse legen die Richtlinien, Standards und Best Practices fest, um Daten im gesamten Unternehmen sicher, genau und konsistent zu verwalten. Eine effektive Governance beschränkt den Zugriff, sodass nur autorisierte Benutzer über eine Berechtigung zur Datennutzung verfügen. Governance schützt und klassifiziert Daten und trägt dazu bei, dass sie in Übereinstimmung mit den gesetzlichen und behördlichen Vorschriften verwendet werden.

Jedes Unternehmen hat die gesetzliche und ethische Verpflichtung, die Vertraulichkeit der von ihm verwalteten Kundendaten zu wahren. Technologien wie Verschlüsselung und Datenredigierung ermöglichen einen sicheren Datenaustausch und schützen gleichzeitig die Privatsphäre. Allerdings kann eine mangelnde Kommunikation zwischen Datenproduzenten und -nutzern zu Fehlinterpretationen führen, die bei der Erstellung von Berichten oder der Beteiligung an datengestützten Entscheidungsfindungsinitiativen zu falschen Annahmen führen können.

Zum Beispiel erlitt die Knight Capital Group3 im Jahr 2012 aufgrund mangelnder Kommunikation und Koordination zwischen den Teams einen Handelsfehler, der dazu führte, dass sie in nur 45 Minuten 440 Millionen US-Dollar verlor. Durch ein Software-Update wurde versehentlich eine ungetestete, undokumentierte und inaktive eingebettete Software aktiviert. Da die Entwickler die potenziellen Auswirkungen der Änderungen auf die Systeme der Händler nicht effektiv kommunizierten, wurden fehlerhafte Handelsgeschäfte in hoher Geschwindigkeit ausgeführt, was zu erheblichen finanziellen Verlusten führte.

Die kostspielige Übertragung von Daten, insbesondere durch ressourcenintensive ETL-Prozesse (Extract, Transform, Load), hat den weit verbreiteten Datenaustausch bisher behindert. Die Aufrechterhaltung der Datenqualität und der Best Practices für die Datenverwaltung kann eine Herausforderung darstellen, insbesondere bei der Verarbeitung großer Datenmengen. Die sichere gemeinsame Nutzung großer Datensätze über Netzwerke ist zeitaufwendig und hochtechnisch und erfordert umfangreiche Investitionen in Speicher und Infrastruktur.

Datensicherheit erfordert strenge Schutzmaßnahmen und Aufklärung, um sensible Daten zu schützen. Informationen, die während des Datenaustauschs über Netzwerke und Plattformen übertragen werden, sind anfällig für Bedrohungen wie unbefugten Zugriff, Datenschutzverletzungen und Cyberangriffe. Darüber hinaus müssen Unternehmen bei der Weitergabe von Daten an externe Partner, Stakeholder oder Drittanbieter komplexe Datenschutzgesetze und -vorschriften beachten.

Best Practices für die gemeinsame Datennutzung

Best Practices für die gemeinsame Datennutzung

Die Umsetzung von Best Practices für die gemeinsame Datennutzung hilft Unternehmen, den Nutzen zu maximieren und gleichzeitig das Risiko zu minimieren.

  • Regelmäßige Bewertungen können dabei helfen, die Effektivität der Daten, der Datenübertragungsprozesse und der Organisationskultur im Zusammenhang mit der gemeinsamen Datennutzung zu bewerten und auf Bedenken einzugehen.
  • Open-Source-Lösungen für den Datenaustausch helfen Unternehmen, die Anbieterbindung zu vermeiden, und eröffnen eine Reihe von in der Community entwickelten Integrationen mit beliebten Open-Source-Frameworks für die Datenverarbeitung und Business Intelligence-Tools, wodurch die Technologie- und Infrastrukturkosten gesenkt werden.
  • Klare Governance-Richtlinien und genau definierte Protokolle für den Datenaustausch führen zu einer verantwortungsvollen Datenverwaltung. Ohne sie könnten Teams auf der Grundlage fehlerhafter Daten arbeiten und die Unternehmensführung könnte Entscheidungen auf der Grundlage schlechter Daten treffen, was das Unternehmen gefährden würde.

Ein Datenmarktplatz ermöglicht es Unternehmen, ihre Daten und Datenprodukte sicher zu teilen und zu monetarisieren. Es gibt einige verschiedene Arten von Datenmarktplätzen:

  • Ein interner Datenmarktplatz dient der gemeinsamen Datennutzung innerhalb eines Unternehmens.
  • Ein privater Datenmarktplatz dient der gemeinsamen Datennutzung mit vertrauenswürdigen Partnern
  • Ein öffentlicher Datenmarktplatz dient der Verbindung von Datenanbietern und Datennutzern.

Öffentliche Datenmarktplätze bieten Teilnehmern eine sichere Umgebung für den Kauf und Verkauf von Daten und damit verbundenen Dienstleistungen, was wiederum die hohe Qualität und Konsistenz der Datenanbieter bestätigt. Unternehmen können einen Datenmarktplatz nutzen, um Daten von Drittanbietern zu erwerben, um ihre bestehenden Datensätze zu erweitern oder um neue Datenprodukte und -dienstleistungen anzubieten und zu monetarisieren.

Arten und Technologien der gemeinsamen Datennutzung

Arten und Technologien der gemeinsamen Datennutzung

Jeder Typ der gemeinsamen Datennutzung erfüllt eine bestimmte Rolle bei der Ermöglichung eines sicheren Informationsaustauschs.

  • Bei der internen Datennutzung liegt der Schwerpunkt darauf, Datensilos innerhalb des Unternehmens abzubauen, um sicherzustellen, dass alle Beteiligten in einer sicheren Umgebung auf die erforderlichen Daten zugreifen können.
  • Die externe Datennutzung umfasst Partner, Kunden, Lieferanten und Aufsichtsbehörden. Da es sich um externe Daten handelt, unterliegen sie strengeren Sicherheitsmaßnahmen zum Schutz sensibler Informationen.
  • Bei internen und externen Typen von Daten gibt es auch öffentliche und private Daten. Öffentliche Daten sind für jeden zugänglich, während private Daten auf bestimmte Einzelpersonen oder Gruppen beschränkt sind.

Die am häufigsten verwendeten Typen von Technologien zur Datennutzung in Unternehmen sind das Data Warehouse und das Data Lakehouse. Diese modernen Datenarchitektursysteme bieten zentrale Speicherorte für die Sammlung, Speicherung und gemeinsame Nutzung großer Datenmengen aus mehreren Unternehmensbereichen. Diese Architekturen umfassen in der Regel Ebenen für Front-End-Clients, Analytics Engines und Datenbankserver.

Über Programmierschnittstellen (APIs) können Softwarekomponenten gemeinsame Definitionen und Protokolle kommunizieren. APIs für die gemeinsame Datennutzung unterstützen differenzierte Zugriffskontrollen und Berechtigungen, die festlegen, welche Daten Datennutzer anfordern können und welche nicht.

Übergreifendes Lernen, Blockchain-Technologie und Datenaustauschplattformen sind weitere Technologien, die die gemeinsame Datennutzung unterstützen. Durch übergreifendes Lernen können KI-Systeme anhand verteilter Datensätze aus verschiedenen Quellen trainiert werden, ohne dass die Daten verschoben werden müssen. Blockchain bietet ein transparentes, unveränderliches Register zur Verfolgung von Transaktionen, einschließlich solcher im offenen Datenaustausch, und sorgt so für Integrität und Sicherheit bei der Datennutzung.

Legacy-Technologien wie das Secure File Transfer Protocol (SFTP) und E-Mail ermöglichen herstellerunabhängige, selbst entwickelte Lösungen, sind jedoch immer schwieriger zu sichern und zu verwalten. Ihnen fehlen fortschrittliche Sicherheitsfunktionen wie die Verschlüsselung ruhender Daten, granulare Datenzugriffskontrollen und automatisierte Audits, die in modernen Lösungen häufiger vorkommen.

Moderne Datenlösungen konzentrieren sich auf die sichere Datennutzung, wobei der Datenspeicher in der Cloud Skalierbarkeit und Zuverlässigkeit bietet, jedoch mit Einschränkungen bei der Zugänglichkeit und Sicherheit. Anbieterspezifische Lösungen zur gemeinsamen Datennutzung bieten integrierte Sicherheit und Skalierbarkeit, sind jedoch häufig mit einer Anbieterbindung verbunden, was die Flexibilität einschränkt und die langfristigen Kosten erhöht.

Zukünftige Trends für die gemeinsamen Datennutzung

Zukünftige Trends für die gemeinsamen Datennutzung

Technologien zur Verbesserung des Datenschutzes, Data Clean Rooms und andere Technologien verbessern den Datenbetrieb durch Automatisierung. Diese Trends verdeutlichen den Wandel hin zu Datenschutz, Dezentralisierung und KI-gestützten Ansätzen bei der Verarbeitung und Analyse von Daten.

PETs

Künftige Trends bei der Datennutzung unterstreichen die zunehmende Bedeutung des Datenschutzes. Technologien zur Verbesserung des Datenschutzes wie sichere Mehrparteienberechnung und Datenmaskierung werden immer wichtiger, um eine nahtlose Datennutzung und einen sicheren Datenschutz in Einklang zu bringen. Die Einführung von PETs verschafft Unternehmen einen Wettbewerbsvorteil, da diese Tools zu einem integralen Bestandteil der Betriebsabläufe werden.

Clean Rooms

Data Clean Rooms sind sichere, auf den Schutz der Privatsphäre ausgerichtete Umgebungen, in denen mehrere Parteien gemeinsam an Daten arbeiten können, ohne Rohdaten zu teilen. Sie ermöglichen es Unternehmen, Analysen durchzuführen und Erkenntnisse zu gewinnen, während sensible Daten geschützt werden, sodass die Datenschutzbestimmungen eingehalten werden. Clean Rooms fördern das Vertrauen zwischen Partnern, indem sie die Offenlegung persönlicher Informationen verhindern und die Weitergabe aggregierter, anonymisierter Daten ermöglichen.

Data Mesh

Ein Data Mesh ermöglicht es einem Unternehmen, Daten als Produkt zu behandeln, sodass sie in einem Self-Service-Format auffindbar und nutzbar sind. Dieser Ansatz ermöglicht es Unternehmenseinheiten, ihre Datenprodukte unabhängig voneinander zu erstellen und zu verwalten. Es ermöglicht auch eine zentralisierte Ansicht von Daten über verschiedene Plattformen und Technologien hinweg und verbessert so die Konnektivität und die Erkenntnisse, ohne dass separate Datenplattformen erforderlich sind.

LLMs

Large Language Models (LLMs) können die Datenverarbeitung und -verarbeitung optimieren, indem sie Aufgaben wie Datenprofilerstellung, Modellierung und Integration automatisieren und so die Datenqualität verbessern. Durch die Bereitstellung generativer KI innerhalb bestehender Dateninfrastrukturen können Unternehmen Routineaufgaben effizienter erledigen und Ressourcen für komplexere Analysen und Entscheidungen freisetzen.

Weiterführende Lösungen

Weiterführende Lösungen

IBM Data Product Hub

IBM Data Product Hub unterstützt die Optimierung der gemeinsamen Nutzung von Daten und automatisiert die Bereitstellung von Datenprodukten für Datennutzer im gesamten Unternehmen.

Entdecken Sie IBM's Data Product Hub

IBM® Cloud Pak for Data

IBM Cloud Pak for Data hilft, die Datenqualität, den Datenschutz und die Compliance zu verbessern und Benutzern, die benötigten Daten schneller zu finden.

IBM Cloud Pak for Data erkunden

IBM watsonx.data™

IBM watsonx.data ist ein skalierbarer, hybrider Datenspeicher, der für KI- und Analyse-Workloads entwickelt wurde. Die Lösung bietet einen uneingeschränkten Datenzugriff, maßgeschneiderte Abfrage-Engines und die Integration in verschiedene Datenumgebungen. So wird eine effiziente Datenaufbereitung und -verwaltung in jeder Cloud- oder On-Premises-Konfiguration ermöglicht.

IBM watsonx.data erkunden
Zugehörige Ressourcen

Zugehörige Ressourcen

IBM und TechD arbeiten zusammen, um Daten sicher zu nutzen und Erkenntnisse mit generativer KI zu gewinnen

Die Partnerschaft von IBM mit TechD nutzt generative KI, um datengestützte Erkenntnisse und Entscheidungsfindungsmöglichkeiten zu erschließen und gleichzeitig den Datenschutz zu gewährleisten.

Was ist Datenspeicher?

Fortschrittliche Datenspeicherlösungen sind entscheidend für die Gewährleistung von geschäftlicher Agilität, Sicherheit und Skalierbarkeit, während sie es Unternehmen ermöglichen, Daten in sich entwickelnden Umgebungen effizient zu verwalten und zu nutzen.

Setzen Sie Ihre Datenstrategie mit einer Data Fabric um

Eine Data-Fabric-Architektur vereinfacht den Datenzugriff, beseitigt Datensilos und verbessert die Entscheidungsfindung, indem sie geschäftsfertige Daten in Hybrid- und Multicloud-Umgebungen bereitstellt.

Machen Sie den nächsten Schritt

Profitieren Sie von der nahtlosen gemeinsamen Nutzung von Daten mit IBM Data Product Hub, einer digitalen Drehscheibe mit Tools zur Bündelung und gemeinsamen Nutzung von Daten aus unterschiedlichen Systemen ohne Anbieterbindung. Entdecken und nutzen Sie effizient die richtigen Datenprodukte aus dem gesamten Unternehmen – mit Richtlinien, die Ihnen helfen, sicherzustellen, dass Datenprodukte auf konforme Weise geteilt und verwendet werden.

IBM Data Product Hub kennenlernen IDC-Whitepaper lesen
Fußnoten

1 Data sharing for research (Link befindet sich außerhalb von IBM.com), The Future of Privacy Forum, August 2022

Knight Capital Group stock trading disruption (Link befindet sich außerhalb von IBM.com), Wikipedia, August 2012