Ein Datenverwaltungsplan (DMP) ist ein Dokument, das die Datenverwaltung während des gesamten Lebenszyklus eines Projekts festlegt, d. h. von der Erfassung bis zur Archivierung.
Diese Dokumente werden in der Regel für Forschungsprojekte verwendet, um die Anforderungen von Geldgebern zu erfüllen. Sie können aber auch in einer Unternehmensumgebung genutzt werden, um Struktur und Abstimmung zwischen Stakeholdern zu schaffen.
Da DMPs die Arten von Daten hervorheben, die innerhalb des Projekts verwendet werden, und sich mit deren Verwaltung während des gesamten Datenlebenszyklus befassen, können Stakeholder, wie z. B. Governance-Teams, zu Beginn eines Projekts eine klare Rückmeldung zur Speicherung und Verbreitung sensibler Daten, wie personenbezogene Daten, geben. Diese Dokumente helfen den Teams, Compliance-Probleme und regulatorische Probleme zu vermeiden, und sie können als Vorlagen für die Herangehensweise und die Verwaltung von Daten in zukünftigen Projekten dienen.
Ein Datenverwaltungsplan besteht in der Regel aus fünf Komponenten:
1. Eine Erklärung zum Zweck
2. Definitionen der Daten
3. Datenerfassung und Zugang
4. Häufig gestellte Fragen (FAQs)
5. Einschränkungen der Forschungsdaten
Jeder dieser Schwerpunktbereiche ermöglicht es Forschungsagenturen und Forschungsfinanzierern (oder vielleicht Ihrem Datenverwaltungsteam), den mit einem bestimmten Projekt verbundenen Risikograd einzuschätzen. Der Datenverwaltungsplan befasst sich auch mit der Frage, wie dieses Risiko gehandhabt werden soll. Wenn beispielsweise sensible Daten im Rahmen eines Projekts verwendet werden, ist es dann angemessen, diese Daten für zukünftige Projekte wiederzuverwenden? Je nach Sensibilität dieser Daten ist dies möglicherweise nicht angemessen oder es kann eine zusätzliche Zustimmung des Benutzers erforderlich sein.
Jede Komponente eines Datenverwaltungsplans konzentriert sich auf eine bestimmte Information und wir werden uns mit jeder Komponente näher befassen.
1. Erklärung zum Zweck: Hier wird erklärt, warum das Team im Laufe des Projekts bestimmte Arten von Daten erfassen muss. Sie sollte die Frage, die das Team mit diesem Datensatz zu beantworten versucht, klar umreißen.
2. Definitionen der Daten: Datenbeschreibungen helfen den Endbenutzern und ihrer Zielgruppe, die Namenskonventionen und ihre Entsprechung mit bestimmten Datensätzen zu verstehen. Einige dieser Informationen können auch in den Metadaten enthalten sein, in der Regel handelt es sich dabei um die Kennzeichnung der Daten nach ihren Datenquellen und Dateiformaten. Die Erstellung und Einhaltung vordefinierter Metadaten-Standards während des gesamten Datenerfassungsprozesses gewährleistet außerdem eine konstante Erfassung und eine reibungslosere Integration.
3. Datenerfassung und Zugang: Dieser Abschnitt eines DMP zeigt auf, wie Daten gesammelt, gespeichert und von einem Datenspeicher abgerufen werden sollen. Er betrifft wahrscheinlich die Datenquelle vorhandener Daten oder den Ansatz, mit dem neue Daten erstellt werden sollen, z. B. ein Experiment. Sie sollte auch Informationen über das Timing der Daten enthalten, d.h. wie oft und über welchen Zeitraum sie aktualisiert werden. Die Art und der Zeitpunkt der Daten bestimmen in der Regel deren Speicher und den Zugang zu Dritten. Unstrukturierte Daten erfordern beispielsweise ein nicht-relationales System im Gegensatz zu einem relationalen System, und größere Datensätze erfordern mehr Rechenleistung im Vergleich zu kleineren. Es kann auch Einschränkungen bei der Weitergabe von Daten aufgrund von Datenschutz- oder geistigen Eigentumsrechten geben. Da die Stakeholder erwarten, dass sensible Daten, wie z. B. personenbezogene Informationen, mit größter Sorgfalt und Sicherheit behandelt werden, ist es wichtig, dass die Dateneigentümer ihre Datenverwaltung, insbesondere in diesem Bereich, klar darlegen. Dazu gehören auch Antworten auf Fragen zur langfristigen Aufbewahrung der Daten, wie z.B. Datenarchivierung oder Wiederverwendung der Daten. Bei Daten, die nicht sensibel sind, wird erwartet, dass Dritten der Zugang zu Rohdaten und Ergebnissen ermöglicht wird.
4. Häufig gestellte Fragen: Dieser Abschnitt kann als Sammelbegriff für andere häufig gestellte Fragen innerhalb von Datenverwaltungsprojekten betrachtet werden, z. B. zu Freigabeplänen, Zitatpräferenzen und Daten-Backup-Methoden. Forscher oder Dateneigentümer können digitale Objektidentifikatoren (Digital Object Identifier, DOI) für Eigentümer von benachbarten oder verwandten Projekten hervorheben. Wenn die Projekteigentümer Daten archivieren, müssen sie außerdem die Dauer des Archivbestands berücksichtigen. Wird es ein Jahr, fünf Jahre oder vielleicht auf unbestimmte Zeit funktionieren?
5. Einschränkungen der Forschungsdaten: In diesem Abschnitt werden die anfänglichen Einschränkungen des Datensatzes behandelt, die eine breitere Verallgemeinerung auf Populationen einschränken. Beispielsweise können sich Daten auf eine bestimmte demografische Gruppe konzentrieren, z. B. auf eine Region, ein Geschlecht, die ethnische Herkunft, eine Altersgruppe usw.
Datenverwaltungspläne werden überwiegend in akademischen Umgebungen eingesetzt, insbesondere für von der Regierung finanzierte Programme wie die National Institutes of Health (NIH) und die National Science Foundation (NSF), aber Unternehmen können sie auch in ihren Forschungs- oder Data Governance-Funktionen nutzen. Während Akademiker und Forscher bei der Beantragung von Fördermitteln die Anforderungen der Geldgeber erfüllen müssen, erstellen viele Forschungseinrichtungen ein DMP-Tool, um den Teilnehmern die relevante Vorlage für ihr Forschungsprojekt zur Verfügung zu stellen. Data Governance-Teams in Unternehmen können ähnliche Protokolle einrichten, um Datenanfragen von Stakeholdern aufzunehmen, die sich für neue Dateninitiativen einsetzen.
Forscher in privaten und öffentlichen Sektoren wenden sich zur Unterstützung von Forschungs- und Innovationsinitiativen an verschiedene Finanzierungsagenturen. DMPs mindern das Risiko für beide Parteien und stellen sicher, dass die Dateneigentümer den Wert sowie ihre eigene persönliche Verantwortung (d. h. Sicherheits- und Notfallwiederherstellungsmaßnahmen) bis hin zur Verwaltung der Forschungsdaten bewertet haben.
Datenverwaltungspläne sind auch für neue Dateninitiativen im Unternehmen äußerst hilfreich. Sie helfen allen Stakeholdern dabei, die Bedeutung neuer Datenquellen zu verstehen und zu klären, wie sie mit den Geschäftsergebnissen verknüpft werden können. Da die Entwicklungen in den Bereichen Hybrid Cloud, künstliche Intelligenz, Internet der Dinge (IoT) und Edge Computing das Wachstum von Big Data weiter vorantreiben, müssen Unternehmen Wege finden, wie sie die Komplexität ihrer Datensysteme verwalten können.
Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.
Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.
Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.