AIのためのデータ品質とガバナンスの確保

第4章

読了時間: 5分

データサイエンティストがデータにすばやく簡単にアクセスできるようにすることは、AIプロジェクトを成功させるために重要ですが、同様に重要なのは、彼らが使用しているデータが関連性があり、高品質であることを保証することです。企業が扱うデータの膨大な量、多様性、速度を考えると、データのカタログ化、タグ付け、整理、アクセス・レベルの管理を行うための効果的なツールが必要になります。

組織は、高度な分析、データサイエンス、およびデータ・エンジニアリングのためのデータの準備に約90%以上の時間を費やしています。¹

IDCの調査によると、2025年には全世界のデータの80％が非構造化データになると予測されており、半構造化データや非構造化データの分析の難しさは、AIやMLに必要な大規模な分析をますます困難にしています。² さらに、人事部門からデータサイエンティスト、業務部門まで、さまざまな役割のビジネス・ユーザーは、さまざまなデータにアクセスする必要があります。ガバナンス・ポリシーは、データ・プライバシーと規制に従って適切なデータ権限を安全に決定するために必要です。

データとデータ使用の文脈を明らかにする
ガバナンス、データ品質、およびデータカタログ機能は、データ・ファブリックの価値の中心にあります。データ・ファブリックは、ユーザーがデータを現状の形で理解できるように自動的にプロファイリングし、目的に合わせて分類します。これにより、さまざまな役割と経験レベルを持つユーザーが組織のデータを活用しやすくなります。

データ・ファブリックのカタログ機能には、次のような便利な機能があります。

これらのカタログ機能は、データの準備や管理に関わるこれまでの手作業や時間の問題を解決するものです。その結果、データ利用者は、適切なガバナンスポリシーを遵守しながら、情報に基づいた意思決定を行うために、関連する組織データからより迅速に価値を引き出すことができます。

グローバルな銀行および金融サービス機関であるINGが、ハイブリッド・クラウド環境でデータ・ファブリックを使用してデータ・アクセスとガバナンスを向上させた方法について説明します。

ブログを読む

AIへのジャーニーを加速する
AIの可能性を最大限に活用するためには、企業が分析やAIモデル開発に利用できる、整備された信頼できるデータが必要です。データ・ファブリックは、アクセスから準備、ガバナンスに至るまで、データ管理の多くの課題と非効率性を解決する自動化技術を導入し、AIをビジネスで活用するための一歩をご支援します。

企業は、次のことに時間の約90%以上を費やしていると報告しています。

オプションを選択してください

分析とデータサイエンスためのデータの準備

アクション可能な洞察のためのデータ分析

現在の運用を最適化して効率を向上

新しいAIモデルの開発、訓練、および検証

組織の時間の90%近くは、高度な分析、データサイエンス、およびデータ・エンジニアリングのためのデータ準備に費やされています。

¹ メタデータ管理の現状：データ管理ソリューションは拡張メタデータ基盤になる必要があります, Gartner, 2021年5月。

² データの80％は今後5年間で非構造化データになります, Solutions Review, 2019年3月28日。