データ・ガバナンスは、組織のデータの品質、セキュリティー、可用性に焦点を当てたデータ管理分野です。データ・ガバナンスは、データの収集、所有権、保存、処理、使用に関するポリシー、標準、手順を定義および実装することで、データの整合性とデータのセキュリティーを確保するのに役立ちます。
データ・ガバナンスの目標は、データ検出やビジネス・インテリジェンスの取り組みにおいて容易にアクセスできる安全で高品質のデータを維持することです。データ・ガバナンス機能は航空交通管制ハブのように機能し、検証済みのデータが安全なパイプラインを介して信頼できるエンドポイントやユーザーに確実に流れるようにします。
人工知能(AI)、ビッグデータ、デジタル・トランスフォーメーションの取り組みは、データ・ガバナンス・プログラムの主な推進力です。モノのインターネット(IoT)テクノロジーなどの新しいデータソースからのデータ量が増加するにつれて、組織はビジネス・インテリジェンス(BI)の取り組みを拡大するためにデータの管理方法を再考する必要があります。
データ・ガバナンス・プログラムは、データ品質の向上、データ・サイロの削減、コンプライアンスおよびセキュリティーに関するポリシーの適用、データ・アクセスの適切な分散によって、組織が大量のデータを保護および管理するうえで役立ちます。
データ・ガバナンスはデータ管理のサブセットであり、戦略的意思決定をサポートし、ビジネス成果を向上させるためにデータを安全かつ効率的に収集、処理、使用する包括的な取り組みです。
データ管理には、データ・ガバナンスの他に、データ・ライフサイクルにおけるデータ処理、データ・ストレージ、データ・セキュリティーなどの領域も含まれます。さらに、データ管理プロセスのさまざまな側面はすべて相互に影響を及ぼします。
これらの領域もデータ・ガバナンスに影響を与える可能性があるため、さまざまなチームが協力してデータ・ガバナンス戦略を設計し、それに従う必要があります。
例えば、データ・ガバナンス・チームは、異種データ・セット間の共通点を特定できる場合がありますが、データを統合する場合は、データ管理チームと協力して、連携を促進するデータ・モデルとデータ・アーキテクチャーを定義することになります。
別の例として、データ・アクセスがあります。データ・ガバナンス・チームは、個人情報(PII)など特定の種類のデータへのアクセス・ポリシーを設定できますが、アクセスを直接提供するか、ユーザーの役割(ロール)に基づきアクセスを承認するロールベースのアクセス制御(RBAC)などのメカニズムを設定するのは、データ管理チームです。
データ・ガバナンスのフレームワークは、組織の構造とプロセスを詳述し、重要なデータ資産を管理します。データの所有権と責任を定義し、データ品質、セキュリティー、およびコンプライアンスを維持するためにデータをどのように扱うべきかを規定します。
フレームワークは通常、特定の組織に固有のデータシステム、データソース、業界プロトコル、政府の規制に合わせてロードマップを調整するものであり、すべてに対応できるフレームワークは存在しません。
データ・ガバナンス・フレームワークは、通常次のような点に対処します。
データ・ガバナンス・プログラムでは通常、データ品質の向上、コンプライアンスのサポート、データ駆動型の意思決定の実現など、特定の目標または一連の目標が定義されます。また、その目標の達成に向けた進捗状況を測定するためのメトリクスも選択されます。データ・ガバナンスでの主要なメトリクスには、以下が含まれます。
データ・エラーと冗長性の削減。
効率の向上と市場投入までの時間の短縮によるコスト削減。
データの一貫性と完全性。
従業員のデータ・リテラシーとプロセス・コンプライアンスのレベル。
また、ガバナンス・プログラムによって、運営委員会、データ所有者、データ・スチュワード、利害関係者など、関係するすべての人の役割と責任も定義されます。
ガバナンス・フレームワークは、ガバナンスの対象となるデータと、望まれる結果に関するパラメーターを設定します。これには、データ形式、データ・モデル、Master Data Management(MDM)、メタデータ、命名規則などのガイドラインの設定が含まれます。
多くの場合、ガバナンス・フレームワークはデータ・フローをマッピングし、データが収集、保管、移動、アーカイブされる方法を定義します。また、これらフレームワークは、ガバナンスの取り組みや組織のより広範なデータ・アーキテクチャーをサポートするハードウェア、ソフトウェア、サービスを特定する場合もあります。
一部のガバナンス・フレームワークでは、マスター・データ、メタデータ、履歴データなどの特定のデータ資産のアクセス・パラメーターであるデータ・スコープが定義される場合があります。データ・スコープは、ユーザーやアプリが必要なデータだけにアクセスできるようにするもので、アクセスされるべきでないデータが誰からもアクセスされないようにするうえで役立ちます。
ガバナンス・フレームワークは、ガバナンス・プログラムの透明性と説明可能性を維持するためのテスト、監査、記録保持の手順を概説するものです。
定期的な監査は、ユーザーがデータ・ガバナンス・フレームワークを遵守していることを確認するのに役立ちます。監査は、新しいデータ、プロセス、テクノロジーを考慮してガバナンス・プログラムを進化させる方法を特定するうえでも役立ちます。
最後に、規制コンプライアンスの達成(とその証明)には監査も役立ちます。
テクノロジーは、効果的なデータ・ガバナンスを実現するうえで重要な役割を果たします。エンタープライズ向けデータ・ガバナンス・ツールには、包括的なプラットフォームから特殊なポイント・ソリューションまでさまざまなものがあります。組織は、独自のデータ・アーキテクチャーやガバナンス・フレームワークに応じて、異なるツールを選択できます。
データ・ガバナンス・ソリューションの一般的な機能は次のとおりです。
データの自動的な特定と分類。
データ保護ルールとロールベースのアクセス制御の適用
プライバシー要件とコンプライアンス要件への対応。
メタデータ管理、データカタログ作成、データ・リネージュ追跡の自動化。
ビジネス用語集のサポート
データ・ガバナンス・ソリューションは、さまざまなデータ形式に対応できます。複雑なデータ・セットやデータ関係の理解を深め、傾向、外れ値、注意が必要な領域などを容易に特定できるようにするための視覚化機能を備えたものもあります。
強力なデータガバナンスのフレームワークを導入することで、組織は以下のようなさまざまなメリットを享受することができます。
組織は、欠陥のあるデータをもとに効果的なビジネス上の意思決定を行うことができません。データ・ガバナンスにより、堅牢なデータ管理、つまり強力なエンドツーエンドのデータ管理プロセスをサポートするフレームワークを作成してデータの整合性、正確性、完全性、一貫性を確保することができます。
信頼できるデータは、組織が新たな機会を発見し、顧客とワークフローをよりよく理解し、全体的なビジネス・パフォーマンスを最適化するのに役立ちます。
データ・ガバナンスの欠如は、パフォーマンス・メトリクスにおけるエラーにつながり、組織を間違った方向に導く可能性があります。一方、データ・ガバナンスツールを導入することで、ストラテジーに影響を与える前に不正確さに対処することができるようになります。
例えば、データ・リネージュ・ツールを使用すると、データ所有者は、抽出・変換・ロード(ETL)または抽出・ロード・変換(ELT)のプロセス中にデータが経験するあらゆる変換を含め、データのライフサイクル全体にわたってデータを追跡できます。これにより、組織はデータ・エラーの根本原因を特定して修正することができるようになります。
組織全体でデータ・アクセスが制限されると、イノベーションが制限され、対象分野の専門家(SME)への依存が生じ、ビジネスプロセスが遅くなる可能性があります。
データ・ガバナンス・プログラムは、データ・アクセスを適切に分散し、各部門や個人に必要なデータのみにアクセスできるようにします。これにより、部門横断的なチームは、データを安全に保ちながら、より緊密で効率的に連携することができます。
適切に管理されたデータシステムは、組織に信頼できる唯一の情報源を提供します。すべての関係者が同じデータセットを使用することで、意思決定のプロセスを改善することができます。
データ定義とメタデータを単一のデータ・カタログに一元管理することで、混乱や非効率性を軽減できます。このドキュメントは、組織全体で一貫したデータとデータ・アクセスを可能にするセルフサービス・ソリューションの基盤となります。
データ・ガバナンスのポリシーには、EUの一般データ保護規則(GDPR)、米国の医療保険の相互運用性と説明責任に関する法律(HIPAA法)などの機密データとプライバシーに関する政府規制や、ペイメントカード業界データセキュリティー基準(PCI DSS)などの業種・業務要件をより簡単に満たすためのオペレーションが含まれることがよくあります。このような規制要件に違反すると、政府から高額の罰金が科せられ、世間の反発を招く可能性があります。
データ・ガバナンス・ツールは、組織がデータの侵害、漏洩、および不正使用を防ぐためのガードレールを設定するうえで役立ちます。ガバナンス・フレームワークは、明確で説明可能な、公正かつ包括的なデータ・システムの構築に役立ちます。そしてこのようなデータ・システムにより、プライバシーとセキュリティーが保護され、顧客のロイヤルティーと信頼を維持することができます。
また、IDCの調査では、セキュリティー侵害や法的責任に関する懸念、顧客データの漏洩、規制リスクから保護するための「責任あるAIの原則を実施するためのルール、ポリシー、プロセス」を整備していると答えた回答者はわずか45.3%でした。1
データ・ガバナンスには、組織が使用するすべてのデータの出所、機密性、ライフサイクルを理解することが含まれます。これはAIガバナンス実践の基盤であり、企業のさまざまなリスクを軽減する上で極めて重要です。
データ・ガバナンスは、組織がデータを保護し、関連する規則や規制に準拠しながら、AIとMLの取り組みに高品質のデータを導入するうえで役立ちます。例えば、機密性の高い個人データがAIに送信されるべきでない場合に、ガバナンス・ツールによりこれを阻止することができます。
データ・ガバナンスの取り組みは、実施時に多くのハードルや課題に直面する可能性があります。これらの課題には、次のようなものがあります。
効果的なデータ・ガバナンスのプログラムには、通常、エグゼクティブと個人貢献者の2つの水準でスポンサーが必要です。最高データ責任者(CDO)とデータ・スチュワードが、組織でのデータ・ガバナンスのコミュニケーションと優先順位付けにおいて重要な役割を果たします。
最高データ責任者は、データ・ガバナンス・ポリシーが確実に施行されるようにデータ関連チーム全体を監督し、説明責任を課すことができます。データ・スチュワードは、データ作成者とデータ利用者にポリシーの認識を促し、組織全体のコンプライアンスが促進されるよう支援します。
適切なスポンサーシップがないと、データユーザーがガバナンス・ポリシーに気づかなかったり、無関心になったりする可能性があります。これにより、コンプライアンス違反、データ整合性の低下、データ・セキュリティー侵害につながる可能性があります。
適切なツールとデータ・アーキテクチャーがなければ、組織は効果的なデータ・ガバナンス・プログラムの導入に苦労する可能性があります。
例えば、チームが異なる部門間で重複するデータを発見した場合を考えてみます。効果的なガバナンスのためには、データ・アーキテクトが適切なデータ・モデルとデータ・アーキテクチャーを開発し、ストレージ・システム間でデータをマージし統合する必要があります。
チームはまた、組織全体のデータ資産のインベントリーを作成するためにデータ・カタログを採用する必要があるかもしれません。または、すでにデータカタログがあれば、メタデータ管理のプロセスを策定する必要があるかもしれません。これは基礎となるデータが適切で最新であることを保証するのに役立ちます。
データ・ガバナンスは、特にハイブリッド環境やマルチクラウド環境では、多くの場合に複数のプロバイダーや場所に複数の形式でデータが保管されます。さらにデータは、データレイクやデータ・レイクハウス、データウェアハウスなど、さまざまな種類のデータ・ストアに保存される可能性があります。
シャドーITがプロセスにさらなる支障をきたす可能性があります。TechTargetの調査によると、データ・セキュリティーの課題として2番目に多かったのは、従業員がIT部門の承認なしにクラウド・アプリケーションやサービスにサインアップしているというものでした。2
このようなデータの分散により、データ・フローやデータ使用量の追跡や監視が困難になる場合があります。データ・ガバナンスには、データのソース、保存先、トランスフォーメーション、依存関係、所有権、アクセス権、責任を明確に理解することが必要です。
データ・ガバナンスのポリシーを複数の環境に適用するには、データ所有者、データ・スチュワード、データ・コンシューマー、データ規制当局など、さまざまな利害関係者間の調整が必要になる場合があります。
セルフサービス分析とビジネス・インテリジェンスの台頭により、データ・ガバナンスには新たな課題が生じています。
これまで以上に多くのユーザーからのアクセス要求がかつてない速さで届く中、ガバナンスチームはスピードとアクセシビリティー、そしてプライバシーとセキュリティー上の懸念との間でバランスを取る必要があります。さらに、ストリーミングデータシステムと手順は、データ漏洩を防ぐために微調整する必要があります。
AIのトレーニングとオペレーションを強化するデータを提供する際、多くの場合にデータ・ストレージとガバナンス・ツールだけでは不十分です。
結局のところ、 AIは標準的なIT主導のプロセスや機能よりも本質的には複雑であり、アクティブで情報に基づいたデータ・ガバナンスの重要性が高まっています。KPMG社のレポートは、現在ビジネスを脅かしている最大リスクの1つとして、AIガバナンスのギャップを強調しています。3例えば、適切なガードレールがなければ、AIによって機密性の高いPIIや企業秘密が意図せず漏洩してしまう可能性があります。
AIのリスクと複雑さを軽減するために、組織はAI用に最適化されたデータ・ストレージ機能と、AIを念頭に置いて考案されたデータ・ガバナンス・プログラムを組み合わせることができます。
データ・ガバナンス・フレームワークの計画と作成には、複数の利害関係者やチームにまたがる時間と労力がかかります。組織がガバナンス・プログラムの実施時に使用する一般的な手法には、次のようなものがあります。
データ・ガバナンス・プロセスの一部を自動化することで、効率を向上させ、エラーを削減することができます。データ・ガバナンスおよびデータ管理ツールは、次のような日常的なタスクの自動化に役立ちます。
強力なデータ・セキュリティーとアクセス制御は、データ・ガバナンス・フレームワークの基礎です。同時に、組織は、特定のデータセットを表示して使用する権限を持つユーザーのデータ・アクセスを、可能な限りスムーズにすることを求めています。このようにセルフサービス情報に簡単にアクセスできないと、コラボレーションや新しい洞察が妨げられてしまいます。
多くの組織は、可視性がないためにデータの管理に苦労しています。中央データカタログは信頼できる唯一の情報源として機能し、データ統合とガバナンスの取り組みを可能にします。
Gartner社のレポートによると、組織が分散した多様なデータ資産の検索、インベントリ作成、分析に苦労しているため、データカタログの需要が高まっています。堅牢なデータ・カタログを使用することで、組織は情報をより簡単に検索して分類できるようになり、データ・ガバナンス・ポリシーをより適切に適用できるようになります。
多くの組織が、明確なガバナンス・ロードマップを作成することが役立つと考えています。このロードマップは成熟度モデルによって提供されます。
データ・ガバナンスの成熟度モデルは、組織がデータ・ガバナンス・プログラムの現在の状態を評価し、目標を設定し、時間の経過に伴う進捗状況を追跡するのに役立つツールです。
組織は、データとガバナンスのメトリクスを経時的に監視するための定期的なアセスメントとレポート作成のメカニズムを確立できます。これらのアセスメントは、組織が問題を特定し、ガバナンスのプロセスを改善するのに役立ちます。
フレームワークを定期的にレビューし、フィードバック、新しい規制、ビジネス・ストラテジーの変更に基づいて調整することで、フレームワークの関連性と有効性を維持できます。
さらに、アセスメントは、データを戦略的資産として評価する文化を育むことができ、組織全体で効果的なビジネス・インテリジェンスとデータの利用をサポートします。
1 「IDC MarketScape: Worldwide AI Governance Platforms 2023 Vendor Assessment」、IDC社、 2023年。
2 「The Need for Data Compliance in Today’s Cloud Era」、 Enterprise Strategy Group by TechTarget社、2023年4月。(PDF)。
3 「Top risk forecast」、 KPMG社、 2024年。
管理されたデータ基盤を構築してデータの成果を加速し、プライバシーとコンプライアンスの要件に対処します。
IBMコンサルティングの支援を受け、EUのAI法に備え、責任あるAIガバナンス・アプローチを確立しましょう。
発見、品質、保護を実現するデータ・ガバナンス・ソフトウェアをご覧ください。