IBMは、IDC MarketScape: Worldwide GenAI Evaluation Technology Products 2025 Vendor Assessmentでリーダーに選出されました。
この評価は、IBM® watsonx.governanceの影響力の拡大と継続的なイノベーション、および信頼性が高く、スケーラブルで、責任あるAIに対する現代の需要を満たすことにおけるIBMの取り組みを反映していると考えています。
「多様なテクノロジー環境を持つ企業は、IBMが中立的なサプライヤーであると感じるかもしれません。たとえば、同社は特定のクラウド・サービスに縛られていません。また、自動化されたドキュメンテーション、ガードレール、セキュリティ製品など、隣接するIBM製品の広範なセットを価値的だと考える企業は、IBMを検討する必要があります」とIDC MarketScapeレポートでは述べられています。
IDC MarketScapeのベンダー分析モデルは、特定の市場におけるテクノロジーとサプライヤーの競争力の概要を提供するように設計されています。この調査方法では、定性的基準と定量的基準の両方に基づいた厳密なスコアリング手法を利用しており、これによって特定の市場における各サプライヤーの位置付けを単一のグラフィックで表示できます。機能スコアは、サプライヤーの製品、市場投入、および短期的なビジネスの実行を測定します。ストラテジー・スコアは、3~5年の期間でサプライヤー戦略と顧客要件との整合性を測定します。サプライヤーの市場シェアはアイコンのサイズで表されます
IDC MarketScapeの厳格な評価フレームワークは、組織がAIモデル評価テクノロジーに関する意思決定を行う際に信頼できる、客観的な第三者によるアセスメントを提供します。
フレームワークでは、次の5つのカテゴリーを考慮します。
私たちが考えるIBMの強みは次のとおりです。
IBM watsonx.governanceは、開発からデプロイメントまでAIライフサイクル全体を管理するための統合アプローチを提供します。ガイド付きアンケートを使用することで、ユーザーはビジネス上の問題を定義し、潜在的なリスクを検知・特定し、緩和ストラテジーを明らかにすることができます。
これらのリスクの側面は、評価プロセス中に使用できるメトリクスにマッピングされます。さらに、この統合プロセスは、評価プロセス中にメタデータを自動的に抽出し、一元化されたファクト・シートに保管し、モデルに関する情報やプロンプトのテンプレートなどを含むアプリケーション開発プロセスの透明性のある記録を提供します。ドキュメンテーションを含むこの緊密に統合されたライフサイクルに評価技術を組み込むことで、企業ユーザーにとって理想的なソリューションとして差別化を図っています。
リスク・データ、リスクとコントロールのアセスメント、内部および外部の損失イベント、主要なリスク指標またはメトリクスを統合することで、チームは企業全体のリスク体制を包括的に把握できます。これにより、企業はリスクが発生したときに、リアルタイムで自動的に特定できるようになります。さらに、IBM watsonx.governanceが自動でリスク評価を提供するため、リスク担当チームはリスクレベルを明確かつ客観的に評価できます。動的なダッシュボードとチャートで迅速な特定、測定、監視、分析を容易にし、自動アラートは、リスクしきい値に達した場合の速やかな修復を可能にします。
IBM watsonx.governanceでは、ユーザーは、AIシステムの性能と有効性を評価するための、事前構築済みのさまざまなメトリクスにアクセスできます。これらには、ドリフトの特定、モデルの性能、およびその他の主要領域に関する以下のメトリクスが含まれます。
とりわけこれらのメトリクスは、AIシステムの性能と有効性を評価するための包括的なフレームワークを提供します。さらに、ユーザーはカスタム・メトリクスを作成し、特定のビジネス要件やリスク・プロファイルに合わせて評価を調整できるため、包括的な評価フレームワークが得られます。
IBMチームによるもう1つのイノベーションは「Evaluation Studio」です。この機能は主に次の2つの性能を提供します。
評価スタジオは、開発者がデータセット上のプロンプトのさまざまなバージョンを評価し、直感的なユーザー・インターフェイスで成果を比較するのに役立ちます。また、ユーザーがメトリクスを選択し、重要度に基づいて重みを割り当てることによって、カスタム・ランキング・スキームを考案できる、独自のカスタム・ランキングのサポートも提供しています。これにより、ユーザーはツールまたはエージェントで使用するプロンプトを簡単に最適化できます。
評価スタジオであるwatsonx.governanceは、より優れたエージェント型AIシステムを構築するための強力なツールである実験追跡もサポートしています。実験をすばやく設定し、さまざまな(エージェントの)変数を試し、使用したモデル、検索ツール、プロンプトなどの詳細をタグ付けできます。レイテンシー、コスト、品質(忠実度など)に基づいて並べて比較することで、最も優れている変数を簡単に確認できます。重要な点として、このプラットフォームが各実行の正確なコードを保存するのに役立つため、開発者は各バージョンを保存する時間から解放され、エージェントの構築と改善に集中できるようになります。
IBM watsonx.governanceソリューションは、エージェント・ガバナンスの新しい基準を設定する、すぐに使用できるデコレーター・ベースのイン・ザ・ループ評価ツールをサポートすることで、お客様がメトリクスを評価し、それを使用してエージェントの実行フローを決定できるようにします。IBM watsonx.governanceは、エージェント評価ツールを介したオフラインでのエージェント評価もサポートしており、構築中のテストデータに基づいてAIエージェントを評価する際に役立ちます。主な機能には以下が含まれます。
この革新的なツールは、エージェントのパフォーマンスに対する比類のない可視性と制御を提供し、お客様がワークフローを最適化し、より良い結果をもたらすことを可能にします。
AI/ML Opsチームをさらに支援するため、IBMは新機能のパイプラインを活用したイノベーションの推進に尽力しています。今後のリリースでは、次のような追加のエージェント・ガバナンス機能を提供予定です。
ガバナンスは、もはやコンプライアンスと監査によって定義される障壁ではありません。現在では、拡張のイネーブラーとなり、チームは堅牢で透明性が高く、エンタープライズでのデプロイメントに対応した生成AIシステムを構築する推進要因となります。ガバナンスとは、ゼロから効率的、安全、信頼できるAIエージェント、アプリケーション、モデルを構築することです。
生成AIが進化し続ける中、watsonx.governanceにより、チームは自信、透明性、コントロールを持って、迅速に行動できるようになります。当社の評価に対するアプローチは、リアルタイムのリスク管理、自動実験管理、あらゆる段階での追跡と透明性に重点を置いています。現実世界の複雑さを念頭に置いて構築されたwatsonx.governanceは、チームが責任を持って拡張し、リスクを軽減し、速度を低下させることなく生成AIの可能性を最大限に解放できるように支援します。