データ・ガバナンスとは

By Matthew Kosinski , Jim Holdsworth , David Zax

データ・ガバナンスとは

データ・ガバナンスは、組織のデータの品質、セキュリティー、可用性に焦点を当てたデータ管理分野です。データ・ガバナンスは、データの収集、所有権、保存、処理、使用に関するポリシー、標準、手順を定義および実装することで、データの整合性とデータのセキュリティーを確保するのに役立ちます。

データ・ガバナンスの目標は、データ検出、ビジネス・インテリジェンス、そしてAI関連の取り組みにおいて容易にアクセスできる安全で高品質のデータを維持することです。データ・ガバナンス機能は航空交通管制ハブのように機能し、検証済みのデータが安全なパイプラインを介して信頼できるエンドポイントやユーザーに確実に流れるようにします。

人工知能（AI）、ビッグデータ、デジタル・トランスフォーメーションの取り組みは、データ・ガバナンス・プログラムの主な推進力です。モノのインターネット（IoT）技術などの新しいデータ・ソースからのデータ量が増加するにつれ、組織はデータ管理のプロセスとデータ・ガバナンスの原則を見直します。適切なプロセスと原則を採用することで、組織はビジネス・インテリジェンス（BI）の取り組みを拡大し、より多くの情報に基づいた意思決定を行うことができます。

エンタープライズAIの急速な発展により、データ・ガバナンスにも新たな戦略が必要になっています。ガバナンス・プログラムは、RAGシステム、ベクトル・データベース、AIエージェントのインプットまたはアウトプットとして機能する構造化データと非構造化データを考慮する必要性がますます高まっています。

堅牢なデータ・ガバナンス・プログラムは、データ品質の向上、データ・サイロの削減、コンプライアンスおよびセキュリティーに関するポリシーの適用、データ・アクセスの適切な分散によって、組織が大量のデータを保護および管理するうえで役立ちます。

データ・ガバナンスとデータ管理

データ・ガバナンスはデータ管理のサブセットであり、戦略的意思決定をサポートし、ビジネス成果を向上させるためにデータを安全かつ効率的に収集、処理、使用する包括的な取り組みです。

データ管理には、データ・ガバナンスの他に、データ・ライフサイクルにおけるデータ処理、データ・ストレージ、データ・セキュリティーなどの領域も含まれます。さらに、データ管理プロセスのさまざまな側面はすべて相互に影響を及ぼします。

これらのデータ管理領域もデータ・ガバナンスに影響を与える可能性があるため、さまざまなチームが協力してデータ・ガバナンス戦略を設計し、それに従う必要があります。

例えば、データ・ガバナンス・チームは、異種データ・セット間の共通点を特定できる場合がありますが、データを統合する場合は、データ管理チームと協力して、連携を促進するデータ・モデルとデータ・アーキテクチャーを定義することになります。クラウドのデータとオンプレミスに格納されたデータでは、適切な戦略が異なる場合があります。

別の例として、データ・アクセスがあります。データ・ガバナンス・チームは、個人情報（PII）など特定の種類のデータへのアクセス・ポリシーを設定できますが、アクセスを直接提供するか、ユーザーの役割（ロール）に基づきアクセスを承認する役割ベースのアクセス制御（RBAC）などのメカニズムを設定するのは、データ管理チームです。人間の従業員ではなくAIエージェントがデータにアクセスする機会が増えている時代においては、アクセス権限を正しく取得することがますます重要になっています。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

データ・ガバナンス・フレームワーク

データ・ガバナンスのフレームワークは、組織の構造とプロセスを詳述し、重要なデータ資産を管理します。データの所有権と責任を定義し、データ品質、セキュリティ、およびコンプライアンスを維持するためにデータをどのように扱うべきかを規定します。

フレームワークは通常、特定の組織に固有のデータ・システム、データ・ソース、業界プロトコル、政府の規制に合わせてロードマップを調整するものであり、すべてに対応できるフレームワークは存在しません。また、古いフレームワークは急速に老朽化する可能性があります。フレームワークは、AI、マルチクラウド・システム、加速的に変化するデータ環境をますます考慮する必要があります。

データ・ガバナンス・フレームワークは、通常次のような点に対処します。

プログラムの目標、役割、義務
データ標準、ポリシー、プロセス
監査手順
データ・ガバナンス・ツール

プログラムの目標、役割、義務

データ・ガバナンス・プログラムでは通常、データ品質の向上、コンプライアンスのサポート、データ駆動型の意思決定の実現など、特定の目標または一連の目標が定義されます。また、その目標の達成に向けた進捗状況を測定するためのメトリクスも選択されます。データ・ガバナンスでの主要なメトリクスには、以下が含まれます。

データエラーと冗長性の削減。
効率の向上と市場投入までの時間の短縮によるコスト削減
データの一貫性と完全性。
従業員のデータ・リテラシーとプロセス・コンプライアンスのレベル。

また、ガバナンス・プログラムによって、運営委員会、データ所有者、データ・スチュワード、利害関係者など、関係するすべての人の役割と責任も定義されます。

運営委員会（またはガバナンス協議会）のメンバーが、データ・ガバナンスのストラテジーとフレームワークの全体的な方向性を監督します。多くの場合この委員会には、Cレベルの管理職や副社長などの上級幹部が含まれ、さまざまな部門を監督しています。
データ所有者は、事業単位全体の特定のデータ・ドメインを監督し、データの正確性、品質、一貫性を維持する責任を負い、データ・ガバナンス・ソリューション、データ・ポリシー、規制要件に関するインプットを提供します。
データ・スチュワードは、特定のデータ・ドメインの日常的な管理を行います。
利害関係者とビジネス・チームは、エンタープライズ・データの消費者です。

データ標準、ポリシー、プロセス

ガバナンス・フレームワークは、ガバナンスの対象となるデータと、望まれる結果に関するパラメーターを設定します。このプロセスには、データ形式、データ・モデル、マスターデータ管理（MDM）、メタデータ、命名規則などのガイドラインを設定することが含まれます。

多くの場合、ガバナンス・フレームワークはデータ・フローをマッピングし、データが収集、保管、複製、移動、アーカイブされる方法を定義します。また、これらのフレームワークは、ガバナンスの取り組みや組織のより広範なデータ・アーキテクチャーをサポートするハードウェア、ソフトウェア、サービスを特定する場合もあります。

一部のガバナンス・フレームワークでは、マスター・データ、メタデータ、履歴データなどの特定のデータ資産のアクセス・パラメーターであるデータ・スコープが定義される場合があります。データ・スコープは、ユーザーやアプリが必要なデータだけにアクセスできるようにするもので、アクセスされるべきでないデータが誰からもアクセスされないようにするうえで役立ちます。

監査手順

ガバナンス・フレームワークは、ガバナンス・プログラムの透明性と説明可能性を維持するためのテスト、監査、記録保持の手順を概説するものです。

定期的または継続的な監査は、ユーザーがデータ・ガバナンス・フレームワークを遵守していることをリアルタイムで検証するのに役立ちます。監査は、新しいデータ、プロセス、テクノロジーを考慮してガバナンス・プログラムを進化させる方法を特定するうえでも役立ちます。

最後に、組織における規制コンプライアンスの達成とその証明にも、監査は役立ちます。

データ・ガバナンス・ツール

テクノロジーは、効果的なデータ・ガバナンスを実現するうえで重要な役割を果たします。エンタープライズ向けデータ・ガバナンス・ツールには、包括的なプラットフォームから特殊なポイント・ソリューションまでさまざまなものがあります。組織は、独自のデータ・アーキテクチャーやガバナンス・フレームワークに応じて、異なるツールを選択できます。

データ・ガバナンス・ソリューションの一般的な機能は次のとおりです。

自動でのデータ検出と分類。
データ保護ルールとロールベースのアクセス制御の適用。
プライバシー要件とコンプライアンス要件への対応
メタデータ管理、データカタログ作成、データ・リネージュ追跡の自動化
ビジネス用語集のサポート

データ・ガバナンス・ソリューションは、さまざまなデータ形式に対応できます。複雑なデータ・セットやデータ関係の理解を深め、傾向、外れ値、注意が必要な領域などを容易に特定できるようにするための視覚化機能を備えたものもあります。データ・ガバナンス・ソリューションが、AIパイプラインで使用されるデータの管理に役立つことが、増えてきています。

AI Academy

生成AIの成功の鍵はデータ管理

生成AIの使用を成功させるために、高品質のデータが不可欠である理由をご覧ください。

エピソードに移動

データ・ガバナンスのメリット

強力なデータガバナンスのフレームワークを導入することで、組織は以下のようなさまざまなメリットを享受することができます。

エンタープライズデータからより多くの価値を引き出す
イノベーションと効率性の促進
信頼できる唯一の情報源（SSOT）を提供する
データ・プライバシー、セキュリティー、コンプライアンスの確保を支援する
AIプロジェクトでのデータの安全な使用
より正確なデータ分析の実現

エンタープライズデータからより多くの価値を引き出す

組織は、欠陥のあるデータをもとに効果的なビジネス上の意思決定を行うことができません。データ・ガバナンスにより、堅牢なデータ管理、つまり強力なエンドツーエンドのデータ管理プロセスをサポートするフレームワークを作成してデータの整合性、正確性、完全性、一貫性を確保することができます。

信頼できるデータは、組織が新たな機会を発見し、顧客とワークフローをよりよく理解し、全体的なビジネス・パフォーマンスを最適化するのに役立ちます。

データ・ガバナンスの欠如は、パフォーマンス・メトリクスにエラーを引き起こし、組織を間違った方向に導く可能性があります。一方、データ・ガバナンス・ツールは、ストラテジーに影響を与える前に不正確さに対処するのに役立ちます。

たとえば、データ・リネージュ・ツールを使用すると、データ所有者は、抽出・変換・ロード（ ETL ）または抽出・ロード・変換（ ELT ）のプロセス中にデータが経験するあらゆる変換を含め、データのライフサイクル全体にわたってデータを追跡できます。これにより、組織はデータ・エラーの根本原因を特定して修正することができるようになります。

イノベーションと効率性の促進

組織全体でデータ・アクセスが制限されると、イノベーションが制限され、対象分野の専門家（SME）への依存が生じ、ビジネスプロセスが遅くなる可能性があります。

データ・ガバナンス・プログラムは、データ・アクセスを適切に分散し、各部門や個人に必要なデータのみにアクセスできるようにします。このプロセスにより、部門横断的なチームは、データを安全に保ちながら、より緊密で効率的に連携することができます。

信頼できる唯一の情報源（SSOT）を提供する

適切に管理されたデータシステムは、組織に信頼できる唯一の情報源を提供します。すべての関係者が同じデータセットを使用することで、意思決定のプロセスを改善することができます。

データ定義とメタデータを単一のデータ・カタログに一元管理することで、混乱や非効率性を軽減できます。このドキュメントは、組織全体で一貫したデータとデータ・アクセスを可能にするセルフサービス・ソリューションの基盤となります。

データ・プライバシー、セキュリティー、コンプライアンスの確保を支援する

データ・ガバナンスのポリシーには、EUの一般データ保護規則（GDPR）、米国の医療保険の相互運用性と説明責任に関する法律（HIPAA法）などの機密データとプライバシーに関する政府規制や、ペイメントカード業界データセキュリティ基準（PCI DSS）などの業種・業務要件をより簡単に満たすためのオペレーションが含まれることがよくあります。近年では、主要な機能としてのデータ・コンポーネントを備えたAIに焦点を当てた規制も登場しています。例としては、欧州AI規制法、欧州データ法、DORAなどがあります。このような規制要件に違反すると、政府から高額の罰金が科せられ、世間の反発を招く可能性があります。

データ・ガバナンス・ツールは、組織がデータの侵害、漏洩、および不正使用を防ぐためのガードレールを設定するうえで役立ちます。ガバナンス・フレームワークは、明確で説明可能な、公正かつ包括的なデータ・システムの構築に役立ちます。そしてこのようなデータ・システムにより、プライバシーとセキュリティーが保護され、顧客のロイヤルティーと信頼を維持することができます。

AIプロジェクトでのデータの安全な使用

また、IDCの調査では、セキュリティー侵害や法的責任に関する懸念、規制リスクから保護するための、責任あるAIの原則を実施するためのルールとプロセスを整備していると答えた回答者はわずか45.3％でした。¹

データ・ガバナンスには、組織が使用するすべてのデータの出所、機密性、ライフサイクルを理解することが含まれます。この理解は、あらゆるAIガバナンス慣行の基礎であり、さまざまな企業リスクを軽減する上で不可欠です。

データ・ガバナンスは、組織がデータを保護し、関連する規則や規制に準拠しながら、AIとMLの取り組みに高品質のデータを導入するうえで役立ちます。たとえば、機密性の高い個人データがAIに送信されるべきでない場合に、ガバナンス・ツールによりこれを阻止することができます。

より正確なデータ分析の実現

適切なデータの保持は、高度なデータ分析とデータサイエンスの取り組みの基盤となります。十分なガバナンスで管理されたデータによって、ビジネス・インテリジェンスのレポートや、より複雑な予測機械学習 (ML)プロジェクトなどの価値ある取り組みが可能になります。

たとえば、データを適切にプロファイリング（データがどのように構造化されているかをよりよく理解するためのレビューやクレンジング）することで、さまざまなデータ・セットやソース間の関係をよりよく理解することができます。

データ・ガバナンスの課題

データ・ガバナンスの取り組みは、実施時に多くのハードルや課題に直面する可能性があります。これらの課題には、次のようなものがあります。

適切なスポンサーシップの欠如
一貫性のないデータ・アーキテクチャー
データの可視性と制御
アクセスの需要増加
AIデータ要件

適切なスポンサーシップの欠如

効果的なデータ・ガバナンスのプログラムには、通常、エグゼクティブと個人貢献者の2つの水準でスポンサーが必要です。最高データ責任者（CDO）とデータ・スチュワードが、組織でのデータ・ガバナンスのコミュニケーションと優先順位付けにおいて重要な役割を果たします。

最高データ責任者は、データ・ガバナンス・ポリシーが確実に施行されるようにデータ関連チーム全体を監督し、説明責任を課すことができます。データ・スチュワードは、データ作成者とデータ利用者にポリシーの認識を促し、組織全体のコンプライアンスが促進されるよう支援します。

適切なスポンサーシップがないと、データユーザーがガバナンス・ポリシーに気づかなかったり、無関心になったりする可能性があります。この状況は、コンプライアンス違反、データ整合性の低下、データ・セキュリティー侵害につながる可能性があります。

一貫性のないデータ・アーキテクチャー

適切なツールとデータ・アーキテクチャーがなければ、組織は効果的なデータ・ガバナンス・プログラムの導入に苦労する可能性があります。

例えば、チームが異なる部門間で重複するデータを発見した場合を考えてみます。効果的なガバナンスのためには、データ・アーキテクトが適切なデータ・モデルとデータ・アーキテクチャーを開発し、ストレージ・システム間でデータをマージし統合する必要があります。

チームはまた、組織全体のデータ資産のインベントリーを作成するためにデータ・カタログを採用する必要があるかもしれません。または、すでにデータカタログがあれば、メタデータ管理のプロセスを策定する必要があるかもしれません。これは基礎となるデータが適切で最新であることを保証するのに役立ちます。

データの可視性と制御

データ・ガバナンスは、特にハイブリッド環境やマルチクラウド環境では、多くの場合に複数のプロバイダーや場所に複数の形式でデータが保管されます。さらにデータは、データレイクやデータ・レイクハウス、データウェアハウスなど、さまざまな種類のデータ・ストアに保存される可能性があります。

シャドーITがプロセスにさらなる支障をきたす可能性があります。TechTargetの調査によると、データ・セキュリティーの課題として2番目に多かったのは、従業員がIT部門の承認なしにクラウド・アプリケーションやサービスにサインアップしているというものでした。²

このようなデータの分散により、データ・フローやデータ使用量の追跡や監視が困難になる場合があります。データ・ガバナンスには、データのソース、保存先、トランスフォーメーション、依存関係、所有権、アクセス権、責任を明確に理解することが必要です。

データ・ガバナンスのポリシーを複数の環境に適用するには、データ所有者、データ・スチュワード、データ・コンシューマー、データ規制当局など、さまざまな利害関係者間の調整が必要になる場合があります。

アクセスの需要増加

セルフサービス分析とビジネス・インテリジェンスの台頭により、データ・ガバナンスには新たな課題が生じています。

これまで以上に多くのユーザーからのアクセス要求がかつてない速さで届く中、ガバナンスチームはスピードとアクセシビリティ、そしてプライバシーとセキュリティ上の懸念との間でバランスを取る必要があります。さらに、ストリーミングデータシステムと手順は、データ漏洩を防ぐために微調整する必要があります。

AIデータ要件

AIのトレーニングとオペレーションを強化するデータを提供する際、多くの場合にデータ・ストレージとガバナンス・ツールだけでは不十分です。

結局のところ、 AIは標準的なIT主導のプロセスや機能よりも本質的には複雑であり、アクティブで情報に基づいたデータ・ガバナンスの重要性が高まっています。KPMG社のレポートは、現在ビジネスを脅かしている最大リスクの1つとして、AIガバナンスのギャップを強調しています。³例えば、適切なガードレールがなければ、AIによって機密性の高いPIIや企業秘密が意図せず漏洩してしまう可能性があります。AI関連の規制（2024年6月に採択されたEUのAI法など）が堅調になっている時代においては、このような機密漏れはさらにコストがかかる可能性があります。

AIのリスクと複雑さを軽減するために、組織はAI用に最適化されたデータ・ストレージ機能と、AIを念頭に置いて考案されたデータ・ガバナンス・プログラムを組み合わせることができます。

データ・ガバナンスのベスト・プラクティス

データ・ガバナンス・フレームワークの計画と作成には、複数の利害関係者やチームにまたがる時間と労力がかかります。組織がガバナンス・プログラムの実施時に使用する一般的な手法には、次のようなものがあります。

自動化で効率アップ
利便性とデータ安全性のバランス
データ・カタログの構築
成熟度モデルを使用
継続的な監視と改善

自動化で効率アップ

データ・ガバナンス・プロセスの一部を自動化することで、効率を向上させ、エラーを削減することができます。データ・ガバナンスおよびデータ管理ツールは、次のような日常的なタスクの自動化に役立ちます。

データ・リネージュを構築して、複雑なハンドコード・ソリューションを必要とせずに、システム内のデータの流れを可視化。
特定のデータ要素（カラムやテーブルなど）にメタデータタグを割り当て、機密情報であることを識別するポリシーを普及させる。
監査ログを生成してデータとのやり取りを記録し、従業員がどのようにデータを使用しているかを理解。

データ分類は、PII、財務データ、知的財産、機密情報など、事前に定義されたカテゴリーに基づく。

利便性とデータ安全性のバランス

強力なデータ・セキュリティーとアクセス制御は、データ・ガバナンス・フレームワークの基礎です。同時に、組織は、特定のデータ・セットを表示して使用する権限を持つユーザーのデータ・アクセスを、可能な限りスムーズにすることを求めています。このようにセルフサービス情報に簡単にアクセスできないと、コラボレーションや新しい洞察が妨げられてしまいます。

データ・カタログの構築

多くの組織は、可視性がないためにデータの管理に苦労しています。中央データカタログは信頼できる唯一の情報源として機能し、データ統合とガバナンスの取り組みを可能にします。

Gartnerのレポートによると、組織が分散した多様なデータ資産の検索、インベントリ作成、分析に苦労しているため、データカタログの需要が高まっています。堅牢なデータ・カタログを使用することで、組織は情報をより簡単に検索して分類できるようになり、データ・ガバナンス・ポリシーをより適切に適用できるようになります。