IBMがデータ出所の透明性の向上を通じて業務効率を向上させる方法

2024年11月4日

所要時間

共同執筆者

Christina Montgomery

Vice President, Chief Privacy & Trust Officer

AIシステムの信頼性は、それを開発するために使用されるデータの信頼性に依存します。そのため、高品質で信頼できるデータを使用することは、責任あるAIを構築するための重要な第一歩となります。しかし、データの出所、データの生成方法、法的および契約上の観点からのデータの使用方法などの詳細に関する透明性がなければ、データセットの信頼性を評価することは、経験豊富なデータ専門家にとっても困難になる場合があります。データ・セットの標準的なメタデータ分類法が欠如していることは、データ・エコシステム全体に共通する問題点です。

そのため、Data & Trust Alliance(D&TA)が業界初の異業種間のデータ出所標準を意味するData Provenance Standardsの策定を進める中、IBM®は積極的に貢献しました。2024年中は、IBMは早期のテスト活動を主導し、必要に応じて社内データ標準をData Provenance Standardsに合わせ始めた最初の組織の1つとなりました。テストが終了し、Data Provenance Standardsバージョン1.0が正式に発表されてから3カ月が経過した現在、データ・デューデリジェンスおよび管理プロセスの全体的な効率に、一貫し、かつ定量化可能な影響が現れています。

トラック上を転がるボールの3Dデザイン

最新のAIニュース + インサイト 


AIやクラウドなどについて、専門家が厳選したインサイトやニュースを、Thinkニュースレターで毎週お届けします。

Data Provenance Standardsを率先して導入する「クライアント・ゼロ」であるIBM

IBMは責任を持ってAIを開発し、導入することに尽力しています。そして、その取り組みは、AIシステムの構築とトレーニングに使用するデータにも及びます。「クライアント・ゼロ」として、IBMはData Provenance Standardsを厳格な環境で評価し、その影響を真に理解し、有意義な方法でテストしたいと考えました。そこで、IBMは、Data Provenance Standardsの包括性の評価から始め、IBMが開発および使用するデータとモデルを管理する独自の 統合ガバナンス・プログラム(IGP)内に主要な要素を導入しました。これを実現するために、Data Provenance Standardsを、基盤モデルの開発に使用されるデータ・セットに対するIBM独自のデータ取り込み要件と比較し、Data Provenance Standardsのメタデータ分類によって、さまざまなユースケースに対するデータの適合性を検証できる程度を評価しました。

次に、さまざまな経験レベルのIBM データ・サイエンティストと研究者に、IBM 独自のデータ、サード・パーティーのデータ、HAP(ヘイト・スピーチ、暴言、冒とく)を含んだデータなど、いくつかの一般的な種類のデータにData Provenance Standardsを適用するよう指示しました。

最後に、IBMのプライバシーおよび責任あるテクノロジー部門の専門家に、Data Provenance Standardsに従ってメタデータ提出の完全性と正確性を検討するよう依頼し、データ・サイエンティストや研究者とともに提出内容を確認して、問題点や混乱をより深く理解しました。この定性的なフィードバックにより、不明瞭または曖昧な用語、定義、ガイダンスを正確に特定することができました。

Mixture of Experts | ポッドキャスト

AIを解読する:1週間のニュースのまとめ

エンジニア、研究者、製品リーダーなど、世界をリードするパネリストがAIに関する最新のニュースとインサイトをお届けします。

データ出所の透明性が業務効率向上に及ぼす影響

社内データ標準をData Provenance Standardsに近づけて調整して以来、最も顕著な影響としては、データクリアランス要求の処理にかかる時間が短縮されました。Data Provenance Standardsをテストし、その他のテクノロジーとプロセスの強化を実践した8カ月間で、サード・パーティーが提供するデータの平均クリアランス処理時間が58%短縮され、IBM独自のデータの場合は、62%も短縮されたことがわかりました。IGPを介したクリアランス要求の急増を考えると、この時間の短縮は極めて重要です。2024年8月までに、サード・パーティーのデータとIBM 独自のデータの両方に対するクリアランス要求の数は、すでに2023年の合計数を上回っていました。

この効率性の向上は非常に価値があります。IBMのデータ・ガバナンス・チームは、より多くのデータ要求をより迅速に処理できるため、信頼性と透明性の基準を維持しながら、データ・ガバナンス・プログラムを拡大できます。Data Provenance Standardsには、データ・デュー・デリジェンス・プロセスの加速に役立った次のような側面があります。

  • 方法:データの収集、生成、またはコンパイルに使用される手順について説明します。これが重要になるなのは、アグリゲーターがこれらの詳細を公開しないことが多く、データの信頼性と妥当性を評価することが困難になるためです。
  • 機密性分類:データ内に存在することがわかっている機密データの種類を特定します。この分類は、適切なデータ・アクセスと処理を促進します。
  • データ発行者:データの発信元およびプロバイダーが実際の所有者であるかどうかについて説明します。サード・パーティーは自分のものであるかのようにデータを再公開できるため、この要素によって説明責任が実現し、潜在的な問い合わせへの連絡窓口を用意できます。

これはIBM組織全体に波及効果をもたらします。データ・クリアランス要求が正確で、より効率的に処理されると、モデル開発が加速され、IBMチームはお客様の要求に迅速に対応できるようになります。また、これは、クリアランスが済んだ状態のデータの企業間カタログが常に拡大し、品質が向上していることを意味し、ビジネス全体の実務者がより効率的かつ責任ある再利用することができます。

データの出所の透明性を通じて新たなビジネス価値を引き出す

透明で一貫性のあるメタデータにより、データ担当者はより迅速かつ情報に基づいたデータ選択を行うことができ、ひいてはより責任あるモデルとシステムの構築を可能にします。これはIBMだけでなく、データ・エコシステム全体に当てはまります。Data Provenance Standardsがより広く採用されるに連れ、さらなる自動化と責任あるイノベーションの両方を通じて、有意義な投資収益率が実現できるようになるでしょう。

Data Provenance Standardsの「クライアント・ゼロ」として同標準を採用した経験から、IBMはAIシステムの基盤となるデータの透明性を改善することにより、信頼への取り組みを強化しています。社内データ標準をData Provenance Standardsに近づけて調整するなど、独自の統合ガバナンス・プログラム(IGP)を管理することにより、IBMは、より迅速かつ確実に AIを市場に投入できるようになりました。また、IBMでは、業界標準やData Provenance Standardsなどのフレームワークに合わせて調整できるようにすることを含め、お客様が独自のデータ・ガバナンス・フレームワークを導入するためのサポートも強化しました。結局のところ、私たちが自社に役立つ何かを実現できるのであれば、お客様にも役立つことを実現できるよう支援できるでしょう。

AIガバナンスを始めるためのガイドを読む

当社のAIガバナンス・サービスの詳細はこちら

関連ソリューション
IBM watsonx.ai

AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。

watsonx.aiをご覧ください。
人工知能ソリューション

業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。

AIソリューションはこちら
AIコンサルティングとサービス

AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。

AIサービスはこちら
次のステップ

AI開発ライフサイクル全体にわたる機能にワンストップでアクセスできます。使いやすいインターフェース、ワークフロー、業界標準のAPIやSDKを利用して、強力なAIソリューションを構築できます。

watsonx.aiの詳細はこちら デモを予約