データ製品は、製品思考アプローチと従来の製品開発原則を適用して開発されます。このアプローチでは、ユーザーのニーズを理解し、主要な機能に優先順位を付け、フィードバックに基づいて繰り返すことが含まれます。最終的には、データを特定のユーザーの問題を解決するために設計された製品として扱います。
データ製品は、検出可能、相互運用可能、実行可能になるように構築されます。ビジネス・ユーザーやデータ・アナリストからデータサイエンティスト、データ・スチュワード、エンジニアにいたる誰もが、企業内に閉じ込められたデータから有意義な価値を引き出すことができるようにします。
データ製品の概念は、ITコンサルティング会社ThoughtWorks社のテクノロジー担当ディレクターであるZhamak Dehghani氏がデータ・メッシュ・アーキテクチャーのコア・コンポーネントとしてデータ製品を紹介した2019年に注目を集めました。データ・メッシュは、特定のビジネス・ドメイン(マーケティング、販売、カスタマー・サービスなど)ごとにデータを整理し、特定のデータセットの作成者にさらなる所有権を与える分散型データ・アーキテクチャーです。
データ製品が効果的に機能するためには、以下にあるようないくつかの重要な特性を備えている必要があります。
利害関係者は、自分のユースケースに適したデータ製品を簡単に見つけることができなければなりません。
データ製品には明確なメタデータが含まれ、特定のビジネス分野に従って構造化され、データ・コンシューマーと各分野のチームが情報を効果的に解釈し適用できるようにする必要があります。
データ製品は、他のシステムとシームレスに統合して、プラットフォーム間で一貫した知見を提供する必要があります。
データ製品は、組織全体に簡単に配布できる一貫性のあるユニットとしてパッケージ化し、チーム間で一貫した使用と理解を保証する必要があります。
適切に設計されたデータ製品は、新しいデータ製品や派生した洞察の作成に再利用できるモジュラー式コンポーネントで構築されているため、効率を高め、余分な労力が削減されます。
McKinsey社の報告によると、データ駆動型の企業は顧客を獲得する可能性が23倍、利益を上げる可能性が19倍高いとのことです。しかし、データ駆動型意思決定の需要が高まっているにもかかわらず、多くの組織は、不十分なデータ・ガバナンス・フレームワークが原因のサイロ、ベンダー・ロックイン、コンプライアンス・リスクなどの障害に直面し続けています。
これらの課題に対処するために、一部の組織では、データを運用の副産物としてではなく、管理された消費可能な資産として扱う製品としてのデータアプローチを採用しています。
製品型データの方法論では、ビジネス上の意思決定を支援し、ユーザー体験を向上させるために、データの構造化と管理を重視します。データ製品はその基盤の上に構築されているため、データ管理に対して構造化されたを提供し、技術チームへの依存を減らしながら、リアルタイムの意思決定をサポートします。
データ製品に投資する組織は、データ・アクセス、相互運用性、データ・ストレージ、ガバナンスの改善を実感できます。業界全体にわたって、データ製品はオートメーションを強化し、データ駆動型の意思決定をサポートし、企業がデータ戦略を長期的なビジネス目標と一致させるのに役立つ可能性があります。堅牢なデータ・プラットフォーム、機械学習モデル、視覚化ツールを活用することで、組織はチームがデータを最大限に活用できるように支援できます。
データ製品は多くの場合、組織内のさまざまな役割に権限を与えることで、次のようなメリットを実現しています。
組織がデータを管理する方法は、受動的な資産ベースのアプローチから、積極的な製品主導のストラテジーへと進化しています。
従来、企業はデータを主に収集して保管するものとして扱ってきました。このアプローチでは、データを中央のデータウェアハウスまたはソース・システムに配置し、主題領域(財務やマーケティングなど)別に整理し、所有権を一元化したチームに割り当てます。成功は多くの場合、保管されたテラバイトなどのデータ量で測定され、単にデータが増やすことで、従業員がそれを使用することを期待しています。
ただし、メタデータは通常IT部門によって定義されており、データ・コンシューマーにとってビジネスに適したものではありません。結果として、データ資産に関する多くの取り組みは、データを事前対応的に使用してビジネス上の問題を解決するのではなく、何が起こったのかを振り返る、記述的分析とレポート作成を中心として展開されています。
これとは対照的に、データを製品として見ると、ストレージから使用と価値の創造に重点が移ります。データ・プロダクトにはデータ・プロダクト・ライフサイクルがあり、アジャイルまたはDataOps方法論に従うソフトウェア製品と同様に、設計、テスト、反復処理が行われます。
所有権はドメイン固有であり(たとえば、マーケティング専門家によって管理されるマーケティング・データ製品)、データの関連性と高品質が維持されます。また、データは、ビジネスによって推進される豊富なメタデータを使用して、特定の消費ニーズに合わせてキュレーションされます。これにより、ビジネス・ユーザーがデータ製品を容易に発見して理解することを保証します。
データ所有者はデータ製品に対して責任を負うため、エンド・ユーザーとのフィードバック・ループを通じて、製品の使用状況、品質、価値が継続的に監視されます。
成功は、単にデータが何テラバイト保管されているかではなく、データがどのように意思決定を改善し、収益を促進し、コストを削減するかによって測定されます。その結果、データ製品イニシアチブは、予測モデリングや規範的モデリングなどの高度な分析を使用してビジネス上の疑問を解決できるようになります。
適切に構造化されたデータ製品は、組織のデータ・エコシステム内で機能性と使いやすさを実現する複数の構成要素で構成されています。
データ製品は、データの品質と改良レベルに基づいて分類できます。データ製品の種類には、次のようなものがあります。
意思決定を支援し、実行可能な洞察を生成する目的で、洗練され、処理され、設計されたデータ製品。
構造化された製品管理ライフサイクルに従うことで、データ・チームは、継続的に価値があり、拡張性が高く、進化するビジネス・ニーズに合わせたデータ製品を構築できます。
データ製品ライフサイクルの主要な段階は次のとおりです。
様々な業界の組織が、ビジネス価値を高め、戦略的取り組みをサポートし、重要なビジネス上の問題を解決するためにデータ製品を活用しています。
データ製品の実例には、次のようなものがあります。
データ製品の開発を成功させるには、データ消費の理解、データ相互作用のマッピング、市場価値のテスト、規模拡大のための反復など、戦略的なアプローチが必要です。
データ製品を構築する最初のステップは、現在の組織内のデータ消費量を分析することです。このステップでは、ターゲット・ユーザーを特定し、ユーザーが消費するデータと、そのデータがユーザーにとって重要である理由を理解します。
データ使用量を量、頻度、感度、種類の観点から検証することで、どのデータセットが最も価値があるかについての知見が得られます。影響力の高いユーザー・グループを優先することで、組織はビジネスに大きく影響する可能性が最も高い領域に最初の作業を集中させることができます。
データ消費パターンが明確になったら、次のステップはデータ・ジャーニーのマッピングです。現実世界のデータの相互作用の詳細なマップを作成すると、さまざまなシステムやチーム間でデータがどのように流れるかを視覚化することができます。
これらのマップは、データ製品の新しい収益を生み出すユースケースをブレインストーミングするための基礎として機能できます。データ製品がビジネス・プロセスをどのように改善できるかについて仮説を立てることは、組織が未加工データを意味のある実行可能な洞察に変える方法を模索し始めるのに役立ちます。
検証済みの洞察があれば、次のステップは反復と拡張です。組織は、中央のITチームだけに頼るのではなく、ビジネス・ドメインやチームにデータ製品を改良・強化する権限を与えることで、俊敏性とイノベーションを促進することができます。いったん改善がなされれば、プロジェクトはより多くのチームやドメインに拡大することができ、データ製品が効果的に拡張され、ビジネス価値を高め続けることが可能になります。
ライフサイクル全体にわたってデータを成果物として管理します。データ・プロダクトのバージョン管理、保守、更新のための堅牢なシステムにより、データ・プロダクトの導入から廃止までのライフサイクルを管理します。
未加工データを実行可能な洞察にすばやく変換し、データ・ガバナンス、品質、リネージ、共有を統合し、信頼性が高くコンテキスト化されたデータでデータ・コンシューマーを支援します。
IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築できます。