Bei der gemeinsamen Datennutzung werden die Datenressourcen eines Unternehmens mehreren Anwendungen, Benutzern und anderen Unternehmen zur Verfügung gestellt. Eine effektive gemeinsame Datennutzung erfordert eine Kombination aus Technologien, Verfahren, rechtlichen Frameworks und organisatorischen Maßnahmen, um mehreren Einheiten einen sicheren Zugriff zu ermöglichen, ohne die Datenintegrität zu gefährden.
Unternehmen, die sich mit Big Data Analytics befassen, betrachten Daten als wertvolles strategisches Asset in ihrem Portfolio. Diese Daten stammen aus verschiedenen Quellen, wie z. B. aus Softwareanwendungen abgeleitete Metriken, Daten zum Kundenverhalten und Signale von Geräten und Sensoren aus dem Internet der Dinge (IoT).
Stellen Sie sich Daten als Bücher in einer Bibliothek vor. Die gemeinsame Datennutzung ist vergleichbar mit einem Bibliotheksausweis, der es jedem im Unternehmen ermöglicht, bei Bedarf auf diese Bücher zuzugreifen und sie auszuleihen. Ohne die gemeinsame Datennutzung müsste jede Abteilung ihre eigene Bibliothek erstellen und pflegen, was zu Doppelarbeit, veralteten Informationen und begrenzten Ressourcen führen würde.
Unternehmen, die Daten austauschen, können effektiver mit Partnern zusammenarbeiten, neue Geschäftsmöglichkeiten schaffen, neue Partnerschaften eingehen und durch Datenprodukte und andere Monetarisierungsmöglichkeiten Einnahmequellen generieren. Die gemeinsame Datennutzung erfordert jedoch die Verpflichtung, die Integrität und Zuverlässigkeit der gemeinsam genutzten Daten während ihres gesamten Lebenszyklus zu wahren und sicherzustellen, dass sie vertrauenswürdig, kohärent und für eine genaue Analyse nützlich bleiben. Durch die erfolgreiche gemeinsame Datennutzung können Stakeholder wertvolle Perspektiven gewinnen, neue Dienstleistungen und Technologien entwickeln und sich auf kommende Trends vorbereiten, indem sie große Datenmengen sowohl innerhalb als auch außerhalb des Unternehmens analysieren.
Unternehmen haben schon lange vor der Erfindung des Internets Daten ausgetauscht, aber Fortschritte in den Bereichen digitale Kompetenz, Technologie und Cloud-Nutzung haben zu einem Echtzeit-Datenaustausch auf globaler Ebene geführt. Technologien für Datenspeicher und -übertragung sind verfügbarer und erschwinglicher als je zuvor. Daher wurden Richtlinien und Vorschriften entwickelt, um die mit der gemeinsamen Nutzung von Daten verbundenen Risiken zu verringern. Die gemeinsame Datennutzung bedeutet mehr als nur den Zugang für Analysen und die Monetarisierung zu ermöglichen. Sie baut auch Barrieren zwischen Geschäftseinheiten und externen Partnern ab. Verschiedene Teams können unabhängig voneinander oder miteinander arbeiten und dabei auf dieselbe aktuelle Datenquelle zugreifen. Die größere Menge und Vielfalt der verfügbaren Daten ermöglicht es verschiedenen Teams im gesamten Unternehmen, zu den übergeordneten Zielen des Unternehmens beizutragen.
Die Kombination von Informationen aus verschiedenen Quellen, wie z. B. Forschungsdaten, Betriebsdaten oder Kundenfeedback, verbessert die Serviceleistung und erhöht den Wert dieser Dienstleistungen. Unternehmensbereiche mit Zugriff auf Daten können beispielsweise mithilfe von Datenanalysen auf der Grundlage von Markttrends und Kundenpräferenzen erfolgreiche Marketingstrategien entwickeln.
Darüber hinaus ermöglicht die gemeinsame Datennutzung Behörden und Unternehmen, ihre Daten auf sichere, rechtmäßige und kontrollierte Weise auszutauschen. Ein wesentlicher Bestandteil der Datensicherheitsmaßnahmen besteht darin, dass die Datenproduzenten die Datensätze sorgfältig dokumentieren und mit genauen Metadaten versehen, um die Reproduzierbarkeit zu unterstützen. Detaillierte Beschreibungen mit klaren Definitionen stellen sicher, dass andere die geteilten Daten leicht finden, entdecken und verstehen können.
Das Future of Privacy Forum1 (FPF) hat Partnerschaften zwischen Unternehmen und akademischen Forschern im Bereich des Datenaustauschs analysiert und festgestellt, dass diese Partnerschaften die gesellschaftlich nützliche Forschung beschleunigen, den Zugang zu wertvollen Datensätzen erweitern und die Reproduzierbarkeit von Forschungsergebnissen verbessern können. Da der Datenaustausch immer weiter verbreitet ist, ergreifen die Stakeholder proaktive Maßnahmen, um Risiken und Datenschutzverletzungen durch die Verwendung von Vereinbarungen zum Datenaustausch (Data Sharing Agreements, DSAs) und Technologien zur Verbesserung des Datenschutzes (Privacy Enhancing Technologies, PETs) zu begegnen.
IBM ist ein gutes Beispiel für die Anwendung strenger Datenschutz- und Sicherheitsprotokolle bei der gemeinsamen Nutzung von Daten, einschließlich der Verwendung von PETs zur Anonymisierung von Daten vor der Weitergabe an Universitäten, gemeinnützige Organisationen und Forschungslabors. Der Ansatz von IBM unterstützt wissenschaftliche Entdeckungen und schützt gleichzeitig sensible Daten, wodurch sicherere und effektivere Partnerschaften gefördert werden. IBM hat beispielsweise mit Melbourne Water in Australien zusammengearbeitet, um Daten zur Reduzierung von Energieemissionen zu analysieren. Während der COVID-19-Pandemie verarbeitete IBM SARS-CoV-2-Genomsequenzen und trug über 3 Millionen Sequenzen zu einem Forschungsarchiv bei.
Ein weiteres überzeugendes Beispiel für den Wert des Datenaustauschs kommt von der gemeinnützigen Organisation „Benefits Data Trust“ aus den USA.2 Benefits Data Trust (BDT) fördert den Datenaustausch zwischen den Bundesstaaten und Unternehmen, die im Gesundheits- und Bildungswesen der USA tätig sind. Durch Vereinbarungen zur gemeinsamen Datennutzung fördert BDT die Einschreibung in entscheidende öffentliche Programme wie das Supplemental Nutrition Assistance Program (SNAP) und Medicaid.
Das Department of Social Services von South Carolina verglich zusammen mit BDT monatliche Medicaid- und SNAP-Listen, in denen sie berechtigte Personen identifizierten, die nicht im Programm registriert waren. Diese Initiative hat seit 2015 zu über 20.000 weiteren SNAP-Anmeldungen geführt und den Zugang zu Ernährungshilfe für gefährdete Bevölkerungsgruppen verbessert. Ähnliche Bemühungen in Pennsylvania waren ebenfalls erfolgreich: Durch den Datenaustausch konnten seit 2005 etwa 240.000 Menschen in verschiedene öffentliche Hilfsprogramme aufgenommen werden.
Die gemeinsame Nutzung von Daten bietet Unternehmen zwar viele Vorteile, birgt aber auch Risiken. Wenn sensible Informationen nicht ordnungsgemäß weitergegeben werden, kann dies für ein Unternehmen zu regulatorischen, wettbewerbsbezogenen, finanziellen und sicherheitsrelevanten Risiken führen. Datennutzer haben nur begrenzte Kontrolle über die Qualität und Verfügbarkeit von Daten. Daten von geringer Qualität können auch versteckte Vorurteile gegenüber Geschlechtern, Rassen, Religionen oder ethnischen Gruppen enthalten.
Data-Governance-Prozesse legen die Richtlinien, Standards und Best Practices fest, um Daten im gesamten Unternehmen sicher, genau und konsistent zu verwalten. Eine effektive Governance beschränkt den Zugriff, sodass nur autorisierte Benutzer über eine Berechtigung zur Datennutzung verfügen. Governance schützt und klassifiziert Daten und trägt dazu bei, dass sie in Übereinstimmung mit den gesetzlichen und behördlichen Vorschriften verwendet werden.
Jedes Unternehmen hat die gesetzliche und ethische Verpflichtung, die Vertraulichkeit der von ihm verwalteten Kundendaten zu wahren. Technologien wie Verschlüsselung und Datenredigierung ermöglichen einen sicheren Datenaustausch und schützen gleichzeitig die Privatsphäre. Allerdings kann eine mangelnde Kommunikation zwischen Datenproduzenten und -nutzern zu Fehlinterpretationen führen, die bei der Erstellung von Berichten oder der Beteiligung an datengestützten Entscheidungsfindungsinitiativen zu falschen Annahmen führen können.
Zum Beispiel erlitt die Knight Capital Group3 im Jahr 2012 aufgrund mangelnder Kommunikation und Koordination zwischen den Teams einen Handelsfehler, der dazu führte, dass sie in nur 45 Minuten 440 Millionen US-Dollar verlor. Durch ein Software-Update wurde versehentlich eine ungetestete, undokumentierte und inaktive eingebettete Software aktiviert. Da die Entwickler die potenziellen Auswirkungen der Änderungen auf die Systeme der Händler nicht effektiv kommunizierten, wurden fehlerhafte Handelsgeschäfte in hoher Geschwindigkeit ausgeführt, was zu erheblichen finanziellen Verlusten führte.
Die kostspielige Übertragung von Daten, insbesondere durch ressourcenintensive ETL-Prozesse (Extract, Transform, Load), hat den weit verbreiteten Datenaustausch bisher behindert. Die Aufrechterhaltung der Datenqualität und der Best Practices für die Datenverwaltung kann eine Herausforderung darstellen, insbesondere bei der Verarbeitung großer Datenmengen. Die sichere gemeinsame Nutzung großer Datensätze über Netzwerke ist zeitaufwendig und hochtechnisch und erfordert umfangreiche Investitionen in Speicher und Infrastruktur.
Datensicherheit erfordert strenge Schutzmaßnahmen und Aufklärung, um sensible Daten zu schützen. Informationen, die während des Datenaustauschs über Netzwerke und Plattformen übertragen werden, sind anfällig für Bedrohungen wie unbefugten Zugriff, Datenschutzverletzungen und Cyberangriffe. Darüber hinaus müssen Unternehmen bei der Weitergabe von Daten an externe Partner, Stakeholder oder Drittanbieter komplexe Datenschutzgesetze und -vorschriften beachten.
Die Umsetzung von Best Practices für die gemeinsame Datennutzung hilft Unternehmen, den Nutzen zu maximieren und gleichzeitig das Risiko zu minimieren.
Ein Datenmarktplatz ermöglicht es Unternehmen, ihre Daten und Datenprodukte sicher zu teilen und zu monetarisieren. Es gibt einige verschiedene Arten von Datenmarktplätzen:
Öffentliche Datenmarktplätze bieten Teilnehmern eine sichere Umgebung für den Kauf und Verkauf von Daten und damit verbundenen Dienstleistungen, was wiederum die hohe Qualität und Konsistenz der Datenanbieter bestätigt. Unternehmen können einen Datenmarktplatz nutzen, um Daten von Drittanbietern zu erwerben, um ihre bestehenden Datensätze zu erweitern oder um neue Datenprodukte und -dienstleistungen anzubieten und zu monetarisieren.
Jeder Typ der gemeinsamen Datennutzung erfüllt eine bestimmte Rolle bei der Ermöglichung eines sicheren Informationsaustauschs.
Die am häufigsten verwendeten Typen von Technologien zur Datennutzung in Unternehmen sind das Data Warehouse und das Data Lakehouse. Diese modernen Datenarchitektursysteme bieten zentrale Speicherorte für die Sammlung, Speicherung und gemeinsame Nutzung großer Datenmengen aus mehreren Unternehmensbereichen. Diese Architekturen umfassen in der Regel Ebenen für Front-End-Clients, Analytics Engines und Datenbankserver.
Über Programmierschnittstellen (APIs) können Softwarekomponenten gemeinsame Definitionen und Protokolle kommunizieren. APIs für die gemeinsame Datennutzung unterstützen differenzierte Zugriffskontrollen und Berechtigungen, die festlegen, welche Daten Datennutzer anfordern können und welche nicht.
Föderiertes Lernen, Blockchain-Technologie und Datenaustauschplattformen sind weitere Technologien, die die gemeinsame Datennutzung unterstützen. Durch föderiertes Lernen können KI-Systeme anhand verteilter Datensätze aus verschiedenen Quellen trainiert werden, ohne dass die Daten verschoben werden müssen. Blockchain bietet ein transparentes, unveränderliches Register zur Verfolgung von Transaktionen, einschließlich solcher im offenen Datenaustausch, und sorgt so für Integrität und Sicherheit bei der Datennutzung.
Legacy-Technologien wie das Secure File Transfer Protocol (SFTP) und E-Mail ermöglichen herstellerunabhängige, selbst entwickelte Lösungen, sind jedoch immer schwieriger zu sichern und zu verwalten. Ihnen fehlen fortschrittliche Sicherheitsfunktionen wie die Verschlüsselung ruhender Daten, granulare Datenzugriffskontrollen und automatisierte Audits, die in modernen Lösungen häufiger vorkommen.
Moderne Datenlösungen konzentrieren sich auf die sichere Datennutzung, wobei der Datenspeicher in der Cloud Skalierbarkeit und Zuverlässigkeit bietet, jedoch mit Einschränkungen bei der Zugänglichkeit und Sicherheit. Anbieterspezifische Lösungen zur gemeinsamen Datennutzung bieten integrierte Sicherheit und Skalierbarkeit, sind jedoch häufig mit einer Anbieterbindung verbunden, was die Flexibilität einschränkt und die langfristigen Kosten erhöht.
Technologien zur Verbesserung des Datenschutzes, Data Clean Rooms und andere Technologien verbessern den Datenbetrieb durch Automatisierung. Diese Trends verdeutlichen den Wandel hin zu Datenschutz, Dezentralisierung und KI-gestützten Ansätzen bei der Verarbeitung und Analyse von Daten.
Künftige Trends bei der Datennutzung unterstreichen die zunehmende Bedeutung des Datenschutzes. Technologien zur Verbesserung des Datenschutzes wie sichere Mehrparteienberechnung und Datenmaskierung werden immer wichtiger, um eine nahtlose Datennutzung und einen sicheren Datenschutz in Einklang zu bringen. Die Einführung von PETs verschafft Unternehmen einen Wettbewerbsvorteil, da diese Tools zu einem integralen Bestandteil der Betriebsabläufe werden.
Data Clean Rooms sind sichere, auf den Schutz der Privatsphäre ausgerichtete Umgebungen, in denen mehrere Parteien gemeinsam an Daten arbeiten können, ohne Rohdaten zu teilen. Sie ermöglichen es Unternehmen, Analysen durchzuführen und Erkenntnisse zu gewinnen, während sensible Daten geschützt werden, sodass die Datenschutzbestimmungen eingehalten werden. Clean Rooms fördern das Vertrauen zwischen Partnern, indem sie die Offenlegung persönlicher Informationen verhindern und die Weitergabe aggregierter, anonymisierter Daten ermöglichen.
Ein Data Mesh ermöglicht es einem Unternehmen, Daten als Produkt zu behandeln, sodass sie in einem Self-Service-Format auffindbar und nutzbar sind. Dieser Ansatz ermöglicht es Unternehmenseinheiten, ihre Datenprodukte unabhängig voneinander zu erstellen und zu verwalten. Es ermöglicht auch eine zentralisierte Ansicht von Daten über verschiedene Plattformen und Technologien hinweg und verbessert so die Konnektivität und die Erkenntnisse, ohne dass separate Datenplattformen erforderlich sind.
Large Language Models (LLMs) können die Datenverarbeitung und -verarbeitung optimieren, indem sie Aufgaben wie Datenprofilerstellung, Modellierung und Integration automatisieren und so die Datenqualität verbessern. Durch die Bereitstellung generativer KI innerhalb bestehender Dateninfrastrukturen können Unternehmen Routineaufgaben effizienter erledigen und Ressourcen für komplexere Analysen und Entscheidungen freisetzen.
Verwalten Sie Daten als Produkt über den gesamten Lebenszyklus hinweg. Verwaltung des Lebenszyklus von Datenprodukten vom Onboarding bis zur Stilllegung mit einem robusten System für die Versionierung, Pflege und Aktualisierung von Datenprodukten.
Wandeln Sie Rohdaten schnell in umsetzbare Erkenntnisse um, vereinheitlichen Sie Data Governance, Datenqualität, -herkunft und -freigabe und stellen Sie Ihren Datennutzern zuverlässige und kontextualisierte Daten zur Verfügung.
Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.
1 Data sharing for research, The Future of Privacy Forum, August 2022
2 Knight Capital Group stock trading disruption, Wikipedia, August 2012