所要時間
AIシステムの信頼性は、それを開発するために使用されるデータの信頼性に依存します。そのため、高品質で信頼できるデータを使用することは、責任あるAIを構築するための重要な第一歩となります。しかし、データの出所、データの生成方法、法的および契約上の観点からのデータの使用方法などの詳細に関する透明性がなければ、データセットの信頼性を評価することは、経験豊富なデータ専門家にとっても困難になる場合があります。データ・セットの標準的なメタデータ分類法が欠如していることは、データ・エコシステム全体に共通する問題点です。
そのため、Data & Trust Alliance(D&TA)が業界初の異業種間のデータ出所標準を意味するData Provenance Standardsの策定を進める中、IBM®は積極的に貢献しました。2024年中は、IBMは早期のテスト活動を主導し、必要に応じて社内データ標準をData Provenance Standardsに合わせ始めた最初の組織の1つとなりました。テストが終了し、Data Provenance Standardsバージョン1.0が正式に発表されてから3カ月が経過した現在、データ・デューデリジェンスおよび管理プロセスの全体的な効率に、一貫し、かつ定量化可能な影響が現れています。
IBMは責任を持ってAIを開発し、導入することに尽力しています。そして、その取り組みは、AIシステムの構築とトレーニングに使用するデータにも及びます。「クライアント・ゼロ」として、IBMはData Provenance Standardsを厳格な環境で評価し、その影響を真に理解し、有意義な方法でテストしたいと考えました。そこで、IBMは、Data Provenance Standardsの包括性の評価から始め、IBMが開発および使用するデータとモデルを管理する独自の 統合ガバナンス・プログラム(IGP)内に主要な要素を導入しました。これを実現するために、Data Provenance Standardsを、基盤モデルの開発に使用されるデータ・セットに対するIBM独自のデータ取り込み要件と比較し、Data Provenance Standardsのメタデータ分類によって、さまざまなユースケースに対するデータの適合性を検証できる程度を評価しました。
次に、さまざまな経験レベルのIBM データ・サイエンティストと研究者に、IBM 独自のデータ、サード・パーティーのデータ、HAP(ヘイト・スピーチ、暴言、冒とく)を含んだデータなど、いくつかの一般的な種類のデータにData Provenance Standardsを適用するよう指示しました。
最後に、IBMのプライバシーおよび責任あるテクノロジー部門の専門家に、Data Provenance Standardsに従ってメタデータ提出の完全性と正確性を検討するよう依頼し、データ・サイエンティストや研究者とともに提出内容を確認して、問題点や混乱をより深く理解しました。この定性的なフィードバックにより、不明瞭または曖昧な用語、定義、ガイダンスを正確に特定することができました。
社内データ標準をData Provenance Standardsに近づけて調整して以来、最も顕著な影響としては、データクリアランス要求の処理にかかる時間が短縮されました。Data Provenance Standardsをテストし、その他のテクノロジーとプロセスの強化を実践した8カ月間で、サード・パーティーが提供するデータの平均クリアランス処理時間が58%短縮され、IBM独自のデータの場合は、62%も短縮されたことがわかりました。IGPを介したクリアランス要求の急増を考えると、この時間の短縮は極めて重要です。2024年8月までに、サード・パーティーのデータとIBM 独自のデータの両方に対するクリアランス要求の数は、すでに2023年の合計数を上回っていました。
この効率性の向上は非常に価値があります。IBMのデータ・ガバナンス・チームは、より多くのデータ要求をより迅速に処理できるため、信頼性と透明性の基準を維持しながら、データ・ガバナンス・プログラムを拡大できます。Data Provenance Standardsには、データ・デュー・デリジェンス・プロセスの加速に役立った次のような側面があります。
これはIBM組織全体に波及効果をもたらします。データ・クリアランス要求が正確で、より効率的に処理されると、モデル開発が加速され、IBMチームはお客様の要求に迅速に対応できるようになります。また、これは、クリアランスが済んだ状態のデータの企業間カタログが常に拡大し、品質が向上していることを意味し、ビジネス全体の実務者がより効率的かつ責任ある再利用することができます。
透明で一貫性のあるメタデータにより、データ担当者はより迅速かつ情報に基づいたデータ選択を行うことができ、ひいてはより責任あるモデルとシステムの構築を可能にします。これはIBMだけでなく、データ・エコシステム全体に当てはまります。Data Provenance Standardsがより広く採用されるに連れ、さらなる自動化と責任あるイノベーションの両方を通じて、有意義な投資収益率が実現できるようになるでしょう。
Data Provenance Standardsの「クライアント・ゼロ」として同標準を採用した経験から、IBMはAIシステムの基盤となるデータの透明性を改善することにより、信頼への取り組みを強化しています。社内データ標準をData Provenance Standardsに近づけて調整するなど、独自の統合ガバナンス・プログラム(IGP)を管理することにより、IBMは、より迅速かつ確実に AIを市場に投入できるようになりました。また、IBMでは、業界標準やData Provenance Standardsなどのフレームワークに合わせて調整できるようにすることを含め、お客様が独自のデータ・ガバナンス・フレームワークを導入するためのサポートも強化しました。結局のところ、私たちが自社に役立つ何かを実現できるのであれば、お客様にも役立つことを実現できるよう支援できるでしょう。
2,000の組織を対象に、AIへの取り組みについて調査を行い、何が機能し、何が機能していないのか、どうすれば前進できるのかを明らかにしました。
IBM Graniteは、ビジネス向けにカスタマイズされ、AIアプリケーションの拡張に合わせて最適化された、オープンで高性能、かつ信頼性の高いAIモデル・ファミリーです。言語、コード、時系列、ガードレールのオプションをご覧ください。
今すぐ個人またはマルチ・ユーザーのサブスクリプションを購入すると、100を超えるオンライン・コースの完全なカタログにアクセスして、低価格でさまざまな製品のスキルを向上させることができます。
IBMのエキスパートが主催するこのカリキュラムは、ビジネス・リーダーが成長を促進するAI投資に優先順位を付けるために必要な知識を習得できます。
AIの投資対効果を高めるために、主要な分野で生成AIの活用を拡大することで、どのように革新的な新規ソリューションの構築、提供を支援し、変化をもたらすかを紹介します。
生成AIと機械学習をビジネスに活用する確実な方法を学びましょう。
強力なAIストラテジーの3つの重要な要素である、競争優位性の創出、ビジネス全体へのAIの拡張、信頼できるAIの推進について詳しく説明します。