Data Science and AI

データ・マネジメントの新たな潮流を定義する4つのユースケース

記事をシェアする:

最も緊急性の高いトピックはどれか、データ・ファブリックがどのように役立つかをご覧ください。

By Jay Limburn|6分で読める|2022年5月10日

 

データ・マネジメントとAIをめぐるさまざまな事象が、企業規模や業種、地理的な位置づけに関係なく押し寄せてきています。マルチクラウド環境へのデータの継続的な拡散など、そのうちのいくつかは、数十年とは言わないまでも、何年も前から迫ってきています。新しいデータ・プライバシー法の制定に向けた世界的な取り組み、すべてのタッチポイントで顧客を個別に把握することへのパンデミック後の期待、AIモデルにおける人種、性別、社会経済的偏りへの注目の高まりなど、比較的最近になってより鮮明になってきたものもあります。

これまで、個々のポイントソリューションでこうした懸念に対処することができましたが、より強固なソリューションが必要であることが急速に明らかになりつつあります。このソリューションは、ビジネスにおける最も差し迫ったデータとAIのニーズに対応すると同時に、追加の課題を解決するための容易な道筋を提供するものです。そのソリューションが、データ・ファブリックです。

データ・ファブリックとは、組織内のデータ・アクセスを簡素化し、セルフサービスによるデータ利用を促進するアーキテクチャーです。このアーキテクチャーは、データ環境、プロセス、ユーティリティ、地理にとらわれず、エンドツーエンドのデータ管理機能を統合しています。データ・ファブリックは、データの発見、ガバナンス、利用を自動化し、企業がデータを利用してバリューチェーンを最大化することを可能にします。データ・ファブリックにより、企業はデータの所在にかかわらず、適切なデータを適切なタイミングで提供することで、データの価値を向上させることができます。データ・ファブリックの主なユースケースを4つ挙げ、その概要と、より詳細な電子ブックや体験版へのリンクを紹介します。これらのユースケースは、リッチで直感的なデータ・ショッピング・エクスペリエンスを実現するための基盤となります。このデータ・マーケットプレイス機能により、企業は高品質な管理されたデータを企業全体に効率的に提供することが可能になります。

 

マルチクラウド・データ統合

データの急速な増加はとどまるところを知らず、サイロ化したデータだけでなく、多数のクラウドにまたがる膨大な数の異なるリポジトリーが存在するようになりました。データが増えればより正確な洞察を得ることができ、複数のクラウドを利用すればベンダー・ロックインを回避し、最適な場所にデータを保存することができます。もちろん課題は、複雑さが増すことで、分析やAIにデータを実際に利用する際の妨げになることです。

データ・ファブリックの一部として、マルチクラウド・データ統合は、適切なデータを適切な人に適切なタイミングで提供できるようにすることを目的としています。ETLとELT、データ・レプリケーション、変更データの取得、データ仮想化などの統合戦略が利用できることは、可能な限り幅広いデータ統合を実現するための鍵です。同様に、データ・カタログとガバナンスは、どのような状況においても「正しいデータ」とは何か、そしてアクセスできるようにすべき「正しい人々」は誰なのかを特定するのに役立ちます。適切なタイミングでのデータ配信に関しては、自動化されたデータ・エンジニアリング作業、ワークロード・バランシング、伸縮性のあるスケーリングが、すべてのビジネスに必要な機敏さを提供するはずです。

eBookを読む

トライアルを開始する

 

 データ・ガバナンスとプライバシー

EUのGDPR、カリフォルニア州のCCPA、カナダのPIPEDAなどのデータ・プライバシー法が制定されたのと同時に、企業はデータ量だけでなくデータ品質を確立するための取り組みを活性化させています。これらの要請を無視した場合のコストは、驚くべきものです。データ品質の低下は、組織に毎年平均1290万ドルのコストをもたらし[1]、2021年1月28日以降のGDPR非準拠により12億ドルの罰金が科されています[2]。

データ・ファブリックのガバナンスとプライバシーのコンポーネントは、編成と自動化に重点を置いています。前のセクションで説明したように、データ仮想化とデータ・カタログ化は、ニーズに最も適したデータを見つけやすくし、それにアクセスしやすくすることで、正しいデータを正しい人に届けることを支援します。メタデータ生成の自動化は、手作業のプロセスをより適切に管理できるようにするために不可欠です。このようにして、ヒューマンエラーを回避し、データにタグを付けることで、個々のリポジトリーではなく、アクセスの時点でポリシーを実施することができます。また、データ・アクセスやリネージュのガバナンスを自動化し、レポートや監査を行うことで、規制の状況を理解し、それを遵守し、各データがどのように使用されたかを常に把握する企業文化を醸成することができます。最終的には、より有用なデータを、より少ない手間で、より優れたコンプライアンスで提供することができるのです。私たちは、6月に新しい機能をリリースすることを発表できることを嬉しく思います。MANTA Automated Data Lineage for IBM Cloud Pak for Data」です。このケイパビリティーは、データ・ユーザーが製品を構築するために使用するデータの起源、変換、および行き先を可視化することを可能にします。

eBookを読む

トライアルを開始する

 

360度の顧客理解

世界的なパンデミックにより、必要に迫られて企業とのデジタルなやりとりが加速し、オンライン、対面、ハイブリッド(カーブサイドと呼ばれる駐車場での受け渡しなど)の特定のニーズに対する利点が明らかになりました。私たちがより普通の日常生活に戻るにつれ、利便性とパーソナライズされたサービスに対する顧客の期待も高まっています。業績の高い企業はこのことを認識しており、カスタマー・エクスペリエンスの向上を今後2~3年の最優先事項として挙げています[3]。

データ・ファブリックは、顧客一人ひとりをより完全に、360度見渡すことができるように設計された一連の機能によって、このニーズに対応します。セルフサービス型のデータ準備ツールは、データセット間のマッチングに必要なデータを準備するための最初のステップとして有効です。顧客属性は、学習可能なインテリジェント・マッチング・アルゴリズムに自動的にマッピングされます。マッチング後は、エンティティ処理により、IDレコードが高品質であることを確認し、エンティティ間の関係を明らかにすることができます。さらに、データをカタログ化し、メタデータを通じてより詳細な情報を適用し、どこに保存されていてもアクセスできるように仮想化します。

eBookを読む

トライアルを開始する

 

MLOpsと信頼性できるAI

AIが組織内でどのように使用されているかが一般に知られるようになるにつれて、モデルに対する監視の目が厳しくなっています。特に人種、性別、社会経済的地位に関する偏りがあれば、長年の好意が失われる可能性があります。しかし、世間体や道徳的な要請を超えて、AIの実装を信頼し、モデルが特定の結果に至った理由を簡単に説明できるようになれば、より良いビジネス上の意思決定につながります。

データ・ファブリックは、データへの信頼、モデルへの信頼、プロセスへの信頼を確立することで、MLOpsと信頼できるAIを実現するのに役立ちます。データに対する信頼は、先に述べた多くの機能の助けを借りて構築され、アクセス権を持つべき人がセルフサービスで利用できるように準備された高品質のデータを提供します。モデルの信頼は、モデル・ライフサイクルの各段階で透明性と説明責任が組み込まれたMLOps-自動化されたデータサイエンス・ツールに依存しています。最後に、AIガバナンスによるプロセスの信頼は、モデルの透明性とトレーサビリティーだけでなく、本番稼動までの時間短縮やスケーラビリティーも支援する一貫した反復可能なプロセスを実現します。

eBookを読む

トライアルを開始する

 

これら 4 つのユースケース、または一般的なデータ・ファブリックにご興味がある場合は、IBM の担当者またはビジネス・パートナーにお問い合わせいただくか、当社のエキスパートとお話する時間をご予約ください。これらのトピックをさらに検討される際に、どのような質問にも喜んでお答えします。

[1] Gartner, “How to Improve Your Data Quality,” July 14, 2021 https://www.gartner.com/smarterwithgartner/how-to-improve-your-data-quality

[2] CNBC, “Fines for breaches of EU privacy law spike sevenfold to $1.2 billion, as Big Tech bears the brunt,” January 2022

[3] IBM Institute for Business Value, “Find your essential,” February 2021 https://www.ibm.com/thought-leadership/institute-business-value/jp-ja/c-suite-study/ceo

More Data Science and AI stories

実践!IBM Cloud Pak for Dataチュートリアル (Multicloud data integration後編)

DataOps, Hybrid Data Management, IBM Cloud Blog...

前編からの続きです。 前編はこちら→ https://www.ibm.com/blogs/solutions/jp-ja/practice-cp4d-04/   3-5. Step 5: Add a Trans ...続きを読む


実践!IBM Cloud Pak for Dataチュートリアル (Multicloud data integration前編)

DataOps, Hybrid Data Management, IBM Cloud Blog...

はじめに   「IBM Cloud Pak for Dataを手軽に試してみたい」という要望にお応えして、クラウド環境で手軽にお試しいただけるチュートリアルが完成しました。チュートリアル全般については こちらの記事  → ...続きを読む


Regions Bank社: 高品質で信頼性の高いAIを開発するための方法論

IBM Data and AI, Others(Please don't use this)

筆者 Manav Misra|3分で読める|2021年5月24日 再現性があり、持続可能で、そしておそらく最も重要なことですが、信頼できる方法で企業がAIを運用するにはどうしたらよいでしょうか。 Regions Bank ...続きを読む