利用可能なAIモデル
エージェントが利用できるAIモデルについて、地域ごとの提供状況やプロバイダーの選択肢を含めてご確認ください。
watsonx Orchestrate IBM がホストするAIモデルとサードパーティ製のAIモデルの両方をサポートしています。 利用可能なモデルは、クラウドプロバイダー、リージョン、およびデプロイメントの種類( AWS、 IBM Cloud、または AWS GovCloud (US))によって異なります。
- このページでは、 AWS、 IBM Cloud、および AWS GovCloud (米国)へのAIモデルのデプロイについて解説します。
GPT-OSS 120B — OpenAI (via watsonx.ai)すべての環境ではサポートされていません。 - GPT-OSSの 120B モデルは、現在オンプレミス環境ではサポートされていません。 オンプレミス展開でサポートされているその他のモデルについては、 「Foundation Models」 を参照してください。
- 廃止予定のモデルは、削除日までは機能しますが、UIに削除通知が表示される場合があります。 サービスが中断しないよう、削除する前に対応機種に切り替えてください。 非推奨のモデルを使用している場合は、「 移行ガイド」 の手順に従って、利用可能なモデルへ移行してください。
地域別のモデル提供状況
特に指定がない限り、ほとんどの地域では、提供されている GPT-OSS 120B — OpenAI モデルがデフォルトのモデルとして使用されます。 カスタムモデルを接続して、利用可能なモデルを拡張します。 各リージョンで利用可能なモデルの詳細については、 AWS のデプロイメント、 IBM Cloud のデプロイメント、および AWS の GovCloud (米国)デプロイメントのページをご覧ください。
AWS 展開
次の表は、 AWS の導入で利用可能なモデルをまとめたものです:
| リージョン | リージョン・コード | 使用可能なモデル |
|---|---|---|
| N。 バージニア | us-east-1 | GPT-OSS 120B (デフォルト) |
| フランクフルト | eu-central-1 | GPT-OSS 120B (デフォルト) |
| シンガポール | ap-southeast-1 | GPT-OSS 120B (デフォルト) |
| ムンバイ | ap-south-1 | GPT-OSS 120B (デフォルト) |
IBM Cloud 展開
次の表は、 IBM Cloud の導入で利用可能なモデルをまとめたものです:| リージョン | リージョン・コード | 使用可能なモデル |
|---|---|---|
| ダラス | 米国南部 | GPT-OSS 120B (デフォルト) |
| トロント | ca-tor | GPT-OSS 120B (デフォルト) |
| ロンドン | eu-gb | GPT-OSS 120B (デフォルト) |
| フランクフルト | eu-de | GPT-OSS 120B (デフォルト) |
| シドニー | au-syd | GPT-OSS 120B (デフォルト) |
| 東京 | jp-tok | GPT-OSS 120B (デフォルト) |
AWS GovCloud (米国)の展開
AWS GovCloud (米国)の展開では、文書検索やコンテンツのモデレーションなどの専門的なAIタスクに、 watsonx.ai モデルが使用されています。
以下の表は、 AWS GovCloud (米国)の導入において利用可能なモデルをまとめたものです:| リージョン | リージョン・コード | 使用可能なモデル |
|---|---|---|
| 米国東部 | us-gov-east-1 | gpt-oss-120b (既定値) |
エージェントビルダーのUIを通じて 「 gpt-oss-120b (デフォルト)」 モデルを設定できるほか、AI Gatewayを通じて「 AWS 」および「 GovCloud (米国)」向けのその他の外部モデルを設定できます。 watsonx.ai を通じて提供されるその他の基盤モデルの利用状況については、 「提供されている基盤モデルの地域別利用状況」 を参照してください。
ADK を使用すれば、 AWS GovCloud (米国)向けの他のモデルも設定できます。 インスタンスへのモデルのインポート方法については、 CLI リファレンスを参照してください。
GPT-OSS「 120B 」モデル
GPT-OSS( 120B )は、処理速度、ツール連携、多言語対応に最適化された高性能モデルです。 このモデルは、以下のプロバイダーからご利用いただけます:
- GroqCloud (デフォルト) および AWS ( AWS へのデプロイ用)および IBM Cloud ( へのデプロイ用)
- watsonx.ai AWS および GovCloud (米国)の展開向け
- この
GPT-OSS 120B — OpenAI (via Groq)モデルでは、最適なパフォーマンスを実現するため、推論ワークロードは GroqCloud のLPUインフラストラクチャを経由して処理されます。 EUのデータ処理は、GDPR準拠のため、EU域内のデータセンター内でのみ行われます。 - これらのモデルはサードパーティのライセンスによって管理されています。 このモデルを使用することにより、あなたはライセンス条項に従うことに同意するものとします。 利用規約をお読みください。
- 顧客データは、モデルのトレーニングのために保存、アクセス、または使用されることはありません。
モデル指定
| プロパティー | 詳細 |
|---|---|
| 作成者 | OpenAI |
| プロバイダー | GroqCloud (デフォルト)、 AWS Bedrock、 watsonx.ai |
| モデル ID | gpt-oss-120b |
| modality | テキストのみ |
| コンテキストウィンドウ | 131,072 トークン(入力と出力の合計) |
| サポート対象言語 | 英語(第一言語)、多言語サポート |
プロバイダーの選択
GroqCloud (デフォルト)
- LPUインフラによる最速の応答時間。
- EUのデータセンター内で処理されるEUのワークロード。
- リアルタイムのやり取りに最適化されています。
AWS Bedrock
- AWS のインフラ要件に対する代替案
- AWS サービスとの地域別提供状況の整合性
- 同等のモデル機能と性能を提供する。
各プロバイダーは独自の運用方針を採用しているため、結果が一致しない場合があります。
ユース・ケース
- リアルタイムチャットと会話型AI
- 高ボリューム自動化ワークフロー
- 意図検出とルーティング
- ドメイン分類
- 軽量エージェントとツールの使用
主要な機能
- 速度 :LPUインフラによる高速な応答時間
- 精度 :強力なルーティングおよび分類性能
- コスト効率 :大規模導入向けに最適化されています
- 柔軟性 :インフラストラクチャのニーズに対応する2つのプロバイダーオプション
カスタムモデルを追加する
AI Gatewayを介して独自のプロバイダーを接続し、利用可能なモデルを拡張します。 手順については、 「AI Gateway による AI モデルの追加」 を参照してください。
移住ガイダンス
非推奨のモデルを使用している場合は、以下の手順に従って移行してください:
- 影響を受けるエージェントを特定する :廃止予定のモデルを使用しているエージェントを確認する
- GPT-OSS 120Bでのテスト :推奨代替案によるパフォーマンス評価
- エージェント指示の更新 :GPT-OSSは明示的な指示フォーマットを必要とします( GPT-OSSモデルの動作と指示ガイドラインを参照)
- パフォーマンスの監視 :応答品質と遅延を比較する
詳細な非推奨情報については、 「非推奨および廃止されたモデル」 を参照してください。