データ・ガバナンスとは?

データ・ガバナンスにより、企業がデータ資産を最大限に活用できるようにする方法について説明します。

臨床の場でタブレット・コンピューターを使用している医療スタッフ
データ・ガバナンスとは?

データ・ガバナンスは、さまざまなポリシーと基準を通じて、組織データの可用性、品質、およびセキュリティーを促進します。 これらのプロセスが、データの所有者、データ・セキュリティー対策、およびデータの使用目的を決定します。 データ・ガバナンス全体の目的は、セキュアで簡単にアクセス可能な、高品質のデータを維持することにより、ビジネスに関する深い洞察を得ることです。

データ・ガバナンスのプログラムにとって一番の推進力となるのは、ビッグデータとデジタル変革への取り組みです。 組織は、モノのインターネット(loT)などの新規データ・ソースによるデータ量の増大に対処するため、データ管理の実践を再検討して、ビジネス・インテリジェンスを拡大する必要があります。 データ・ガバナンスのプログラムが効果的となるのは、データ品質の向上や、データ・サイロの削減、コンプライアンスおよびセキュリティーの確保、そしてデータ・アクセスを適切に分散させることに取り組む場合です。


データ・ガバナンスとデータ管理の比較

データ管理は、データ・ガバナンスよりも適用される範囲が広くなります。 それは、組織データの取り込み、処理、保護、および保存を行う業務として定義することができます。その業務は、組織データを戦略的な意思決定に活用し、ビジネスの成果を向上させることを目的とします。 データ管理には、データ・ガバナンスが含まれますが、その他の領域であるデータ処理、データ・ストレージ、およびデータ・セキュリティーなどのデータ管理ライフサイクルも含まれます。 データ管理に含まれるそのような領域は、データ・ガバナンスに影響を与える場合もあるため、各領域におけるチームと協力して、データ・ガバナンス戦略を実行する必要があります。 たとえば、データ・ガバナンス・チームは、異種混合のデータ・セット全体における共通点の特定はできますが、それらを統合する場合には、データ管理チームと連携し、データ・モデルおよびデータ・アーキテクチャーを定義することにより、それらのつながりを促進する必要があります。 別の例として、データ・アクセスが挙げられます。データ・ガバナンス・チームは、特定の種類のデータ(例:個人情報(PII))に対するデータ・アクセスに関し、ポリシーの設定ができますが、一方でデータ管理チームは、そのアクセスの直接的な提供、または仕組みを導入(例:組織内で定義されたユーザーの役割を活用してアクセスを承認)することにより、そのアクセスの提供ができます。  


データ・ガバナンスのメリット

データ・ガバナンスのフレームワークを導入することで、組織内のデータの価値を高めることができます。 データ・ガバナンスは、データ全体の精度の向上に貢献するので、そのデータを基にした結果に影響を与えることになります。その影響は、より単純な日常のビジネスに関する意志決定から、より複雑な自動化の構想にまで至ります。 その他の主なメリットは以下の通りです。

  • 拡張およびデータ・リテラシーの推進:組織全体にわたってデータ・アクセスが限られている場合、革新が制限され、各業務のプロセスにおける対象分野の専門家(SME)への依存関係を生み出してしまいます。 データ・ガバナンスの実践により、機能横断的なチームが協力して、システム全体のデータに対する理解を共有する(例:ドメインに依存しない個々のデータの差を一致させる)ための道を開くことができます。 このように共有された理解を基にデータ標準が形成され、それにより、データ・カタログのように、データ定義およびメタデータを一元化された場所で文書化することが可能になります。 そしてその文書化は、APIなどのセルフサービス・ソリューションの基礎となることで、組織全体にわたって一貫性のあるデータを実現し、そのデータへの統合アクセスを可能にします。   
  • セキュリティー、データ・プライバシー、およびコンプライアンスの確保:データ・ガバナンス・ポリシーは、EUの一般データ保護規則(GDPR)、米国の医療保険の積算と責任に関する法律(HIPAA)、およびクレジットカード業界データ・セキュリティー(PCI DSS)を含めた業界要件など、重要データおよびプライバシーに関する官公庁・自治体の要求を満たす方法を提供します。 これらの規制要件に違反する場合は、官公庁・自治体による高額な罰金、および大衆の反発を引き起こす可能性があります。 企業はそれを避けるために、データ・ガバナンスのツールを採用してガードレールを設定し、データ侵害およびデータの悪用を防止します。
  • 高品質のデータ:データ・ガバナンスは、データ保全性や、データの正確度、完全性、および一貫性を確保します。 企業は、優れたデータを持つことにより、ビジネス全体のパフォーマンスを最適化する方法だけでなく、自社のワークフローおよび顧客についても理解を深めることができます。 ただし、パフォーマンス・メトリックスに誤りが生じると、組織を誤った方向へ導いてしまう可能性があります。しかしその場合も、データ・ガバナンス・ツールにより、潜在的な不正確性に対処することができます。 たとえば、データ・リネージュ・ツールにより、データ所有者は、データをライフサイクルを通じて追跡することができます。これには、ETLまたはELTのあらゆるプロセス中に適用された任意のソース情報やデータ変換が含まれます。 それにより、いかなるデータエラーについても、根本原因を詳しく調査することができます。
  • データ分析の促進:良質なデータは、より高性能なデータ分析およびデータ・サイエンスの構想を行うための基盤を築きます。これには、ビジネス・インテリジェンス報告プロジェクト、またはより複雑な予測機械学習プロジェクトを含めることができます。 それらは、主な利害関係者が基盤となるデータを信頼する場合にのみ優先的に行われ、それ以外の場合は、採用されない可能性があります。

データ・ガバナンスの課題

データ・ガバナンスに利点があることは明確ですが、データ・ガバナンスの構想を成功させるためには、多くのハードルを克服する必要があります。 それらの課題には以下のものが含まれます。

  • 組織的なアライメント:データ・ガバナンス・プログラムを開始する際の最大の課題の1つは、主要なデータ資産は何か、そしてそれらの個々の定義と形式がどうあるべきかということに関し、組織全体にわたって利害関係者の認識を一致させることです。 顧客データに関する議論については、規制ポリシーによっていくつかの構成を整備できますが、マスター・データ管理(MDM)に分類されるような、より製品固有となるデータなどについては、意見の一致が難しい場合があります。
  • 適切なスポンサーシップの欠如:優れたデータ・ガバナンス・プログラムを行うためには、組織の幹部レベルと作業者レベルの2つのレベルにて、通常スポンサーシップが必要となります。 最高データ責任者(CDO)とデータ・スチュワードは、組織内のデータ・ガバナンスに関するコミュニケーションおよび優先順位付けにおいて重要となります。 最高データ責任者は、データ・チーム全体の責任追跡性を監視および強化することにより、データ・ガバナンス・ポリシーを確実に採用できるようにします。 データ・スチュワードは、それらのポリシーに関して、データ・プロデューサーおよびデータ消費者の意識を高める支援を行い、組織全体のコンプライアンスを促進できるようにします。
  • 関連データのアーキテクチャーおよびプロセス:適切なツールおよびデータ・アーキテクチャーがない場合、企業は有効なデータ・ガバナンス・プログラムを導入することが困難になります。 たとえば、チームが異なる機能間で冗長データを発見した場合、データ・アーキテクトが適切なデータ・モデルおよびデータ・アーキテクチャーを開発し、ストレージ・システム全体にわたるデータをマージして統合する必要があります。 またチームが、データ・カタログを採用して、組織全体にわたるデータ資産のインベントリーを作成することや、既にそれを持つチームは、メタデータ管理のプロセスをセットアップして、基礎となるデータが有効かつ最新であることを確実にしなければならない場合があります。

IBMソリューション

IBM Cloud Pak for Data

データ・ファブリック・アーキテクチャーで構築されたプラットフォームを使用して迅速に結果を予測します。 所在場所を問わず、データを収集、編成、分析します。


IBM Watson Knowledge Catalog

積極的なメタデータとポリシーの管理に裏打ちされたインテリジェントなカタログ化により、AIと分析のためのビジネス対応データを活用できるようにします。



次のステップ

IBM Cloud Pak for Dataでは、マイクロサービス、主要なデータ、AIの機能を活用して、分散システム全体でデータのインテリジェントな統合を自動化し、企業にビジネス・パフォーマンスの全体像を提供します。 これにより、エンタープライズ・データの迅速な収集と編成、洞察の獲得が可能になり、企業は大規模な意思決定を行うことができるようになります。 またデータ管理チームは、規制ポリシーの遵守を確実にし、あらゆるコンプライアンスのリスクを削減することによって、IBMの優れたセキュリティー・フレームワークを使用すれば自社データが安全であると信頼することもできます。 IBM Cloud Pak® for DataとIBM Streamsが、複数の環境全体にわたるビジネスのデータを理解および管理するために、どのように役立つのかについてご覧ください。