利用可能なAIモデル

エージェントが利用できるAIモデルについて、地域ごとの提供状況やプロバイダーの選択肢を含めてご確認ください。

watsonx Orchestrate IBM がホストするAIモデルとサードパーティ製のAIモデルの両方をサポートしています。 利用可能なモデルは、クラウドプロバイダー、リージョン、およびデプロイメントの種類( AWS、 IBM Cloud、または AWS GovCloud (US))によって異なります。

注:
  • このページでは、 AWS、 IBM Cloud、および AWS GovCloud (米国)へのAIモデルのデプロイについて解説します。 GPT-OSS 120B — OpenAI (via watsonx.ai) すべての環境ではサポートされていません。
  • GPT-OSSの 120B モデルは、現在オンプレミス環境ではサポートされていません。 オンプレミス展開でサポートされているその他のモデルについては、 「Foundation Models」 を参照してください。
  • 廃止予定のモデルは、削除日までは機能しますが、UIに削除通知が表示される場合があります。 サービスが中断しないよう、削除する前に対応機種に切り替えてください。 非推奨のモデルを使用している場合は、「 移行ガイド」 の手順に従って、利用可能なモデルへ移行してください。

地域別のモデル提供状況

特に指定がない限り、ほとんどの地域では、提供されている GPT-OSS 120B — OpenAI モデルがデフォルトのモデルとして使用されます。 カスタムモデルを接続して、利用可能なモデルを拡張します。 各リージョンで利用可能なモデルの詳細については、 AWS のデプロイメントIBM Cloud のデプロイメント、および AWS の GovCloud (米国)デプロイメントのページをご覧ください。

AWS 展開

次の表は、 AWS の導入で利用可能なモデルをまとめたものです:

表 1.AWS の展開における地域別のモデル利用状況
リージョン リージョン・コード 使用可能なモデル
N。 バージニア us-east-1 GPT-OSS 120B (デフォルト)
フランクフルト eu-central-1 GPT-OSS 120B (デフォルト)
シンガポール ap-southeast-1 GPT-OSS 120B (デフォルト)
ムンバイ ap-south-1 GPT-OSS 120B (デフォルト)

IBM Cloud 展開

次の表は、 IBM Cloud の導入で利用可能なモデルをまとめたものです:
表 2. IBM Cloud の展開における地域別のモデル利用状況
リージョン リージョン・コード 使用可能なモデル
ダラス 米国南部 GPT-OSS 120B (デフォルト)
トロント ca-tor GPT-OSS 120B (デフォルト)
ロンドン eu-gb GPT-OSS 120B (デフォルト)
フランクフルト eu-de GPT-OSS 120B (デフォルト)
シドニー au-syd GPT-OSS 120B (デフォルト)
東京 jp-tok GPT-OSS 120B (デフォルト)

AWS GovCloud (米国)の展開

AWS GovCloud (米国)の展開では、文書検索やコンテンツのモデレーションなどの専門的なAIタスクに、 watsonx.ai モデルが使用されています。

以下の表は、 AWS GovCloud (米国)の導入において利用可能なモデルをまとめたものです:
表 3. AWS GovCloud (米国)の展開における地域別のモデル利用状況
リージョン リージョン・コード 使用可能なモデル
米国東部 us-gov-east-1 gpt-oss-120b (既定値)

エージェントビルダーのUIを通じて 「 gpt-oss-120b (デフォルト)」 モデルを設定できるほか、AI Gatewayを通じて「 AWS 」および「 GovCloud (米国)」向けのその他の外部モデルを設定できます。 watsonx.ai を通じて提供されるその他の基盤モデルの利用状況については、 「提供されている基盤モデルの地域別利用状況」 を参照してください。

ADK を使用すれば、 AWS GovCloud (米国)向けの他のモデルも設定できます。 インスタンスへのモデルのインポート方法については、 CLI リファレンスを参照してください。

GPT-OSS「 120B 」モデル

GPT-OSS( 120B )は、処理速度、ツール連携、多言語対応に最適化された高性能モデルです。 このモデルは、以下のプロバイダーからご利用いただけます:

  • GroqCloud (デフォルト) および AWS ( AWS へのデプロイ用)および IBM Cloud ( へのデプロイ用)
  • watsonx.ai AWS および GovCloud (米国)の展開向け
重要:
  • この GPT-OSS 120B — OpenAI (via Groq) モデルでは、最適なパフォーマンスを実現するため、推論ワークロードは GroqCloud のLPUインフラストラクチャを経由して処理されます。 EUのデータ処理は、GDPR準拠のため、EU域内のデータセンター内でのみ行われます。
  • これらのモデルはサードパーティのライセンスによって管理されています。 このモデルを使用することにより、あなたはライセンス条項に従うことに同意するものとします。 利用規約をお読みください
  • 顧客データは、モデルのトレーニングのために保存、アクセス、または使用されることはありません。

モデル指定

プロパティー 詳細
作成者 OpenAI
プロバイダー GroqCloud (デフォルト)、 AWS Bedrock、 watsonx.ai
モデル ID gpt-oss-120b
modality テキストのみ
コンテキストウィンドウ 131,072 トークン(入力と出力の合計)
サポート対象言語 英語(第一言語)、多言語サポート

プロバイダーの選択

GroqCloud (デフォルト)

  • LPUインフラによる最速の応答時間。
  • EUのデータセンター内で処理されるEUのワークロード。
  • リアルタイムのやり取りに最適化されています。

AWS Bedrock

  • AWS のインフラ要件に対する代替案
  • AWS サービスとの地域別提供状況の整合性
  • 同等のモデル機能と性能を提供する。

各プロバイダーは独自の運用方針を採用しているため、結果が一致しない場合があります。

ユース・ケース

  • リアルタイムチャットと会話型AI
  • 高ボリューム自動化ワークフロー
  • 意図検出とルーティング
  • ドメイン分類
  • 軽量エージェントとツールの使用

主要な機能

  • 速度 :LPUインフラによる高速な応答時間
  • 精度 :強力なルーティングおよび分類性能
  • コスト効率 :大規模導入向けに最適化されています
  • 柔軟性 :インフラストラクチャのニーズに対応する2つのプロバイダーオプション
注: GPT-OSSは他のモデルとは動作が異なります。 UIで選択されたエージェントスタイルは動作に影響しません。 エージェントの指示において、トーン、構造、応答パターンを明示的に定義する。 詳細については、 「GPT-OSSモデルの動作と使用ガイドライン」 を参照してください。

カスタムモデルを追加する

AI Gatewayを介して独自のプロバイダーを接続し、利用可能なモデルを拡張します。 手順については、 「AI Gateway による AI モデルの追加」 を参照してください。

移住ガイダンス

非推奨のモデルを使用している場合は、以下の手順に従って移行してください:

  1. 影響を受けるエージェントを特定する :廃止予定のモデルを使用しているエージェントを確認する
  2. GPT-OSS 120Bでのテスト :推奨代替案によるパフォーマンス評価
  3. エージェント指示の更新 :GPT-OSSは明示的な指示フォーマットを必要とします( GPT-OSSモデルの動作と指示ガイドラインを参照)
  4. パフォーマンスの監視 :応答品質と遅延を比較する

詳細な非推奨情報については、 「非推奨および廃止されたモデル」 を参照してください。