データ管理計画とは

データ管理のコンポーネントを把握し、組織内におけるデータ駆動型の意思決定を推進します。

机でキーボードを使って入力している従業員を横から見たビュー
データ管理とは

データ管理計画(DMP)は、プロジェクトのライフサイクル全体にわたって、つまり、データの取得からアーカイブまでのデータの処理方法を定義するドキュメントです。 これらのドキュメントは通常、資金提供者の要件を満たしている研究プロジェクトに使用されますが、企業環境内でも活用でき、利害関係者間の構造と調整を作成できます。 DMPはプロジェクト内で使用される予定のデータのタイプと データライフサイクル全体でプロジェクトの管理に対処するデータのタイプをいち早く特定するので、ガバナンス・チームなどの利害関係者は、プロジェクトの開始時に、個人情報(PII)などの機密データの保存と配信に関する明確なフィードバックを提供できます。 これらのドキュメントにより、チームはコンプライアンスや規制上の落とし穴を回避でき、将来のプロジェクトのデータにアプローチして管理する方法のテンプレートとして利用できます。


データ管理計画のコンポーネント

データ管理計画には通常、次の5つのコンポーネントがあります。

1. 目的の記載 
2. データの定義  
3. データの収集とアクセス 
4. よくある質問(FAQ)  
5. 研究データの制限 

これらの重点分野のそれぞれによって、研究機関および研究資金提供者(またはおそらくデータ管理チーム)が、特定のプロジェクトに関連するリスクの量を評価することを可能にします。 データ管理計画は、そのリスクを管理する方法にも対応しています。 たとえば、機密データがプロジェクト内で使用されている場合、そのデータを将来のプロジェクトで再利用することは適切なのでしょうか? そのデータの機密性によっては、適切でない場合や、追加でユーザーの同意が必要な場合があります。   

データ管理計画の各コンポーネントは、特定の情報に焦点を当てています。それぞれについて詳しく説明します。

1. 目的の記載: これは、チームがプロジェクトの過程で特定のタイプのデータを取得する必要がある理由を説明しています。 チームがこのデータセットで回答しようとしている質問の概要を明確に示す必要があります。

2. データの定義: データの説明は、エンド・ユーザーとその対象者が、命名規則と特定のデータセットとの対応を理解するのに役立ちます。 この情報の一部はメタデータ内に保持される場合もあり、通常はデータ・ソースとファイル形式によってデータのラベル付けを行います。 データ取得プロセス全体で事前定義されたメタデータ標準を作成して順守することで、また、より一貫性のあるデータ収集とよりスムーズな統合プロセスが保証されます。

3. データの収集とアクセス:  DMPのこのセクションでは、データ・リポジトリからデータを収集、保存、およびアクセスする方法について説明します。 これは、既存のデータのデータ・ソース、または実験などの新しいデータを作成するために採用されるアプローチに対応するでしょう。 また、データのタイミングに関する情報、つまり、データが更新される頻度とその期間に関する情報も含まれている必要があります。 データのタイプとタイミングは、通常、データの保存と第三者へのアクセスについて通知します。 たとえば、非構造化データには 非リレーショナル ・システムと リレーショナル ・システムが必要で、大きなデータセットは、小さなデータセットと比較してより多くの計算能力を必要とします。 また、プライバシーや知的財産権により、データ共有に制限がある場合があります。 プロジェクトの利害関係者は、個人識別情報(PII)などの機密データが細心の注意とセキュリティーにより処理されることを期待するため、データ所有者は、特にこの分野でのデータ管理プラクティスについて明確にすることが重要です。 これには、データのアーカイブやデータの再利用など、データの長期保存に関する質問への回答が含まれます。 本質的に機密性の低いデータについては、第三者が生データや研究結果にアクセスするための経路を提供することが期待されます。

4. よくある質問: このセクションは、共有計画、引用の記述スタイルの設定、データのバックアップ方法など、データ管理プロジェクト内の他の一般的な質問の「キャッチオール」と見なすことができます。 研究者またはデータ所有者は、隣接する、または関連するプロジェクトの所有者のデジタル・オブジェクトID(DOI)を強調表示することができます。 さらに、プロジェクトの所有者がデータをアーカイブしている場合は、アーカイブの存在期間にも対処する必要があります。 それは1年、5年、またはおそらく無期限になるでしょうか。

5. 研究データの制限: このセクションでは、データセットの事前の制限について説明します。これによって、データをより広く母集団に一般化する機能が制限されます。 たとえば、データは、地理、性別、人種、年齢層などの特定の人口統計に焦点を当てています。


データ管理計画の使用者について

データ管理計画は、特に国立衛生研究所(NIH)や国立科学財団(NSF)などの連邦政府が資金提供するプログラムのように、主により学術的な場面で使用されますが、企業は研究またはデータ・ガバナンス機能のいずれかで、データ管理計画を活用することもできます。 学者や研究者は助成金申請において資金提供者の要件に準拠する必要がありますが、多くの研究機関は、参加者に研究プロジェクトに関連するテンプレートを提供するためのDMPツールを作成しています。 組織内のデータ・ガバナンス・チームは、新しいデータ・イニシアチブを提唱する利害関係者からのデータ要求を取り込むために同様のプロトコルを設定できます。

データ・ガバナンスのツールとソリューションの詳細はこちら

データ管理のユースケース

助成金申請

官民両セクターの研究者は、研究とイノベーションのイニシアチブを後援するためにさまざまな資金提供機関に目を向けています。 DMPは、両方の当事者のリスクを軽減し、データ所有者がデータ管理を調査するための価値と、自身の個人的な責任(つまり、セキュリティと災害復旧対策)を評価していることを確認します。


データ・ガバナンス・イニシアチブ

データ管理計画は、ビジネス環境における新しいデータ・イニシアチブにも非常に役立ち、すべての利害関係者が新しいデータ・ソースの重要性と、それがビジネスの成果にどのように結びつくかを理解するのに役立ちます。  ハイブリッドクラウド、 人工知能、モノのインターネット(IoT)、 エッジコンピューティング 内の発展がビッグデータの成長を促進し続けるため、企業はデータシステム内でビッグデータの複雑性を管理する方法を見つける必要があります。


データの収集と管理を合理化する

データ管理をよりシンプルかつスマートにするRedHat® OpenShift®オープン・プラットフォーム上に構築されたAIを活用したIBMソリューションをご覧ください。

その他の詳細はこちら オープンソースのパートナーシップはこちら ハイブリッドクラウドとは 人工知能とは エッジコンピューティングとは