業種・業務が信頼できるAIに焦点を当てるのは、企業の社会的責任体制、評判リスクに関する懸念、規制の強化など、複数の要因によって推進されています。組織は、AIと機械学習を信頼し、運用できるようにするためには、体系的なアプローチが必要であることを認識しています。信頼できるAIの側面には、公平性や堅牢性、プライバシー、説明可能性、透明性などがあります。ユースケースのパターンとしては、既存アプリケーションのヘルスチェックや、AIガバナンスのための組織全体的なフレームワークの作成などが挙げられますが、ここでは新しいアプリケーションの運用に焦点を当てます。
組織は、新しいAIアプリケーションを信頼できる方法で構築して運用するための体系的なアプローチを必要としています。このアプローチでは、エンドツーエンドのデータサイエンスとAIのライフサイクルを考慮する必要があります。AI ライフサイクルは、さまざまなペルソナとベスト・プラクティスをまとめた一連の段階で構成されています。(一般的な見解については、オライリーのレポート「Operationalizing AI」を参照)。ライフサイクルには次の段階が含まれます。
理想的なシナリオでは、信頼できるAIの側面は、最終段階だけでなく、これらの各段階で対処される必要があります。ビジネス定義、データ探索、モデル構築からモデルの検証、デプロイメント、監視、継続的な管理に至るまで、各段階で適切なガードレールが必要です。各段階で詳しく見て行き、信頼できるAIのさまざまな側面がどのように対処されているかをご覧ください。
この段階では、ユースケースの優先順位付けとAIアクションプランの策定をガイドします。ビジネス利害関係者、データサイエンティスト、データ所有者、オペレーション・リーダーなどの役割で構成されたチームは、まずビジネス・ユースケース、ビジネス価値の定義、ビジネスKPIの明確化に焦点を当てます。次に、技術的なタスクに対処し、ビジネス目標を特定のAIタスクに変換して解決します。最後に、チームは、ビジネス目標をサポートするために、特定された技術タスクを解決するための構造化されたアクションプランを作成します。
この段階では、エンタープライズ・デザイン思考の原則を適用することがベスト・プラクティスです。デザイン思考は、ユースケースのコンテキストでバイアス/公平性、堅牢性、説明可能性などのさまざまなビジネスおよび技術的側面を特定・定義するのに役立ちます。この段階では、次のような質問に答えることができます。
また、本番環境での使用の検証を行う際に土壇場での課題が発生するのを防ぐために、チームがこれらのユースケースを構築する際に従う必要がある組織のデータとAIポリシーに留意することも重要です。
この段階では、データ・コンシューマーは関連するデータセットを見つけてアクセスできるようになります。データサイエンス・チームは、メタデータまたはビジネス用語を使用して検索を行い、中央カタログで「データを購入」できます。データの所有者、リネージュ、他のデータセットとの関係などを含むデータを理解できます。データサイエンティストにデータ・リネージュの技術的なビューを提供することで、主要な機能の作成方法や使用方法に影響を与える可能性のある各データ変換をデータサイエンティストが理解できるようになります。
その調査に基づいて、データフィードを要求できます。承認されるとデータサイエンス・チームがデータサイエンス開発環境でデータセットを利用できるようになります。
チームが個人情報やPHIなどの規制対象の個人データを扱う必要がある場合、データ・スチュワードやデータ・プロバイダーは、適切な匿名化を通じてデータ共有が規制に準拠していることを確認する必要があります。
データサイエンス・チームは、この段階でデータを探索して準備し、AI/MLモデルを構築、トレーニング、テストします。この段階のアクティビティーは、一連のアジャイル・スプリントとして実行するのが最適です。モデル構築の作業を開始する前であっても、この段階でデータのバイアスをチェックすることが重要です。これは公平性を確保するための内部的なガードレールであり、そのようなガードレールはモデル構築ステップの間やその後に設置できます。モデルの堅牢性、説明可能性、その他の側面も、同様にこの段階で考慮され、テストできます。
これらのテストが正常に完了すると、MLOpsパイプラインにより、モデルと関連資産を開発環境から事前検証環境に移動できるようになります。
この段階には、モデルの検証と実稼働環境への導入が含まれます。検証活動は、組織のモデル検証チームやモデル・リスク管理チームなど、モデルを構築したチーム以外のチームや外部機関によって実施される場合があります。
このチームは、品質、堅牢性、公平性などを検証し、検証レポートを作成します。参照と比較のために検証の成果を取得することが重要です。モデルとなるファクトシート、ローカルおよびグローバルな説明、その他のメトリクスもチェックされます。
モデルが検証に合格すると、運用チームは MLOps パイプラインを使用してモデルを実稼働環境にプロモートできます。モデルは、オンラインまたはバッチ呼び出しのいずれかでそこにデプロイされます。
この段階では、運用チームが本番環境でのAI/MLモデルの継続的な監視と管理を設定します。チームは、メトリクスの定期的なスケジュール収集のモニターを設定します。品質、堅牢性、公平性は、ビジネス・ニーズによって定められた頻度で監視されます。データと精度のドリフトを監視し、選択したトランザクションやグローバルな動作について説明を生成することは、継続的なアクティビティーの例です。
モニターがしきい値の違反を検知した場合、企業はアラートから是正手順に至るまでの行動を選択できます。バイアスの軽減やモデルの再トレーニングのステップを設定することで、信頼できる動作を継続的に実現できます。モデルは、ビジネス的基準または技術的基準に基づいて廃止できます。この段階では、信頼できるAIのための最も外側にあるガードレールが確立されます。
これらの AI ライフサイクルステージは、企業全体のAIガバナンスフレームワークに適合します。このようなフレームワークにより、使用される開発ツールに関係なく、複数のユースケースがライフサイクル段階で一貫して従うことができます。ライフサイクル全体にわたるドキュメンテーションを自動化し、さまざまな利害関係者に一貫したビューを提供します。
信頼できるAIを運用するには、人(専門知識)、プロセス(ベスト・プラクティス)、プラットフォーム(テクノロジー)を結集する必要があります。IBM Cloud Pak for DataとIBM Spectrum Fusionは、エンドツーエンドのAIライフサイクルのさまざまな段階をサポートするテクノロジーフレームワークを提供します。既存の環境に適合し、既存のモデル開発およびデプロイメント・ツールを補完できます。このプラットフォームは、さまざまなクラウド(IBM、AWS、Azure、GCPなど)やオンプレミス・インフラストラクチャーの選択上で実行できるため、真のハイブリッドクラウド機能を実現できます。
IBMは、顧客が信頼できるAIの運用を開始できるよう、教育プログラム、専門知識、ベスト・プラクティス、テクノロジーを結集した一連のサービスを提供しています。