AIのためのデータ品質とガバナンスの確保
データサイエンティストがデータにすばやく簡単にアクセスできるようにすることは、AIプロジェクトを成功させるために重要ですが、同様に重要なのは、彼らが使用しているデータが関連性があり、高品質であることを保証することです。 企業が扱うデータの膨大な量、多様性、速度を考えると、データのカタログ化、タグ付け、整理、アクセス・レベルの管理を行うための効果的なツールが必要になります。
組織は、高度な分析、データサイエンス、およびデータ・エンジニアリングのためのデータの準備に約90%以上の時間を費やしています。1
IDCの調査によると、2025年には全世界のデータの80%が非構造化データになると予測されており、半構造化データや非構造化データの分析の難しさは、AIやMLに必要な大規模な分析をますます困難にしています。2 さらに、人事部門からデータサイエンティスト、業務部門まで、さまざまな役割のビジネス・ユーザーは、さまざまなデータにアクセスする必要があります。 ガバナンス・ポリシーは、データ・プライバシーと規制に従って適切なデータ権限を安全に決定するために必要です。
データとデータ使用の文脈を明らかにする
ガバナンス、データ品質、およびデータカタログ機能は、データ・ファブリックの価値の中心にあります。 データ・ファブリックは、ユーザーがデータを現状の形で理解できるように自動的にプロファイリングし、目的に合わせて分類します。これにより、さまざまな役割と経験レベルを持つユーザーが組織のデータを活用しやすくなります。
データ・ファブリックのカタログ機能には、次のような便利な機能があります。
これらのカタログ機能は、データの準備や管理に関わるこれまでの手作業や時間の問題を解決するものです。 その結果、データ利用者は、適切なガバナンスポリシーを遵守しながら、情報に基づいた意思決定を行うために、関連する組織データからより迅速に価値を引き出すことができます。
グローバルな銀行および金融サービス機関であるINGが、ハイブリッド・クラウド環境でデータ・ファブリックを使用してデータ・アクセスとガバナンスを向上させた方法について説明します。
AIへのジャーニーを加速する
AIの可能性を最大限に活用するためには、企業が分析やAIモデル開発に利用できる、整備された信頼できるデータが必要です。 データ・ファブリックは、アクセスから準備、ガバナンスに至るまで、データ管理の多くの課題と非効率性を解決する自動化技術を導入し、AIをビジネスで活用するための一歩をご支援します。