AIゲートウェイ
Instana watsonx.ai やその他の外部LLMサービスへの接続を LLMゲートウェイでサポートし、様々な生成AI(gen AI)ユースケースを実現します。 LLMゲートウェイを設定することで、 Instana の生成AI機能を駆動する接続とLLMを制御し、内部ポリシー、パフォーマンス要件、データガバナンス基準との整合性を確保できます。 環境内のすべてのLLMゲートウェイを作成、監視、設定、および保守できます。
デプロイメント・オプション
SaaS
SaaS 環境では、 Instana がデフォルトのLLMゲートウェイを提供し、追加設定なしで watsonx.ai に自動接続してLLMを活用します。 さらに、独自の watsonx.ai ランタイムに接続するためのLLMゲートウェイを作成できます。
自己ホスティング
セルフホスト環境(Standard エディションまたは Custom エディション)では、独自の watsonx.ai ランタイムまたは vLLM-based の推論サービスに接続できます。
機能フラグの有効化
セルフホスト型 Instana 環境でAIゲートウェイ機能を利用するには、AIゲートウェイの機能フラグを有効にする必要があります。
セルフホスト型 Standard Edition におけるAIゲートウェイの機能フラグを設定するには、 「 Standard Edition のオプション機能の有効化」 を参照してください。
セルフホスト型カスタムエディション( Kubernetes または Red Hat OpenShift Container Platform ) で AI ゲートウェイの機能フラグを設定するには、 「カスタムエディションでのオプション機能の有効化」 を参照してください。
サポート対象のLLMサービス
以下のLLMサービスに対してLLMゲートウェイを作成できます:
- watsonx.ai (IBM Cloud)
- watsonx.ai ( OpenShift 上でセルフホスティングし、データには Cloud Pak を使用( Instana のバージョン 1.0.313 以降))
- vLLM-compatible 推論サービス( Red Hat AI Inferencing Server (RHAIIS) を含む)(パブリックプレビュー)
サポート対象のLLM
生成AI機能は以下の大規模言語モデル(LLM)によってサポートされています
生成AI機能
Instana でサポートされている生成AI機能のうち、LLMゲートウェイとの連携設定が可能なものは以下の通りです:
- AI アシスタント
- インシデントの要約
- インシデント調査
- Kubernetes AIアシスタント
- 手動アクション生成
- スクリプト生成
- SLOアシスタント
ユーザー許可の管理
Instana のUIでジェネレーティブAIの全機能を利用するには、以下のユーザー権限が必要です:
- AIゲートウェイへのアクセス:AIゲートウェイのUIへの読み取り専用アクセスを有効にします
- LLMゲートウェイの作成、設定、削除:AIゲートウェイのUIへのフルアクセスを有効にします
- すべてのジェネレーティブAI機能を利用可能: Instana のUIからAIを活用した機能にアクセスできるようになります
詳細については、 「ユーザーアクセスの管理」 を参照してください。
Instana をLLMゲートウェイに接続する
LLMゲートウェイを設定および構成するには、次の手順を完了してください。
接続を設定する。
- ナビゲーションペインで 「AIゲートウェイ」 をクリックします。 LLMゲートウェイのペインが表示されます。
- LLMゲートウェイを作成をクリックしてください。 LLMゲ ートウェイ作成ウィザードが表示されます。
- 接続を設定するを選択してください。
- 接続設定で、LLMゲートウェイへのアクセスに使用する以下のサービスのいずれかを選択してください:
- IBM watsonx : watsonx を設定する場合は、以下の詳細を入力してください:
- watsonx API キー : watsonx サービスへのアクセス認証用 API キー。
- watsonx プロジェクト名 :プロジェクトの名称。
- watsonxURL : watsonx サービス向けの URL。
- vLLM :外部の vLLM-based (仮想大規模言語モデル)サービスを設定する場合は、以下の詳細を入力してください:
- エンドポイント URL : vLLM サービスがホストされている URL。
- エンドポイントの API キー(任意) :エンドポイントに安全にアクセスするための認証キー。
- IBM watsonx : watsonx を設定する場合は、以下の詳細を入力してください:
- 設定を確認するには、 「接続テスト」 をクリックしてください。
- IBM watsonx について:接続に失敗した場合は、 API キー、プロジェクト ID、および URL が正しく、有効であることを確認してください。 テストが成功したことは、 Instana が watsonx サービスと通信できることを確認するものです。
- vLLM の場合:接続に失敗した場合は、エンドポイント URL にアクセスできること、および API のキーが正しいことを確認してください。 テストが成功したことは、 Instana が vLLM サービスと通信できることを確認するものです。
- 次へ をクリックします。
注:vLLM サービスでは、 Kubernetes のAIアシスタント機能はサポートされていません。機能とAIモデルを選択してください。
- 「 機能とAIモデルの選択」 セクションで、以下の機能のいずれかを選択してください:
- AI アシスタント
- 手動アクション生成
- インシデントの要約
- インシデント調査
- スクリプト生成
- SLOアシスタント
- AIモデルを選択してください:
- Granite :汎用モデル
- ミストラル(中級):バランスの取れた性能
- ミストラル(大型):複雑なタスクに対応する高容量
- Openai/gpt-oss-120b: 分析や洞察が必要な業務において。 (SLOアシスタントには openai/gpt-oss-120b モデルが必要です)
- 「次へ」をクリックして続行します。
- 「 機能とAIモデルの選択」 セクションで、以下の機能のいずれかを選択してください:
モデルを設定する。
- モデルの動作を微調整するには、以下のパラメータを設定してください:
- トークン制限(単位:千) :リクエストごとの最大トークン数(例:
100)。 - 最大遅延時間 :応答時間の最大値(例:
1秒)。 - 反復ペナルティ :反復されるフレーズを抑制する(例:
1)。 - 温度 : ランダム性を制御します(例:
0.2から まで1)。 - top_k : サンプリングするトークンの数(例:
50)。 - top_p : 累積確率のしきい値(例:
0.5)。
- トークン制限(単位:千) :リクエストごとの最大トークン数(例:
- 次へをクリックして進むか、 戻るをクリックして修正してください。
- モデルの動作を微調整するには、以下のパラメータを設定してください:
ゲートウェイの詳細を入力してください。
- 名前 : ゲートウェイに固有の名前を入力してください。
- 説明 : ゲートウェイの説明を入力してください。
「作成」 をクリックして設定を完了してください。
LLMゲートウェイの表示
設定済みのLLMゲートウェイを確認するには、ナビゲーション ペインで 「AIゲートウェイ」 をクリックします。 LLM ゲートウェイテーブルが表示され、設定済みの全ゲートウェイとそのステータスが表示されます。 それらを有効化または無効化し、設定の詳細を確認できます。
| パラメーター | 説明 |
|---|---|
| 名前 | ゲートウェイ設定の名前。 各ゲートウェイは特定の汎用AIユースケースに対応します。 |
| 機能 | ゲートウェイがサポートするジェネレーション AI function (例:スクリプト生成、アクション生成、インシデント要約)。 |
| タイプ | ゲートウェイがデフォルトのシステム構成であるか、ユーザー定義であるかを示します。 |
| 使用サービス | ゲートウェイを駆動するLLMサービス(例: IBM、 watsonx )。 |
| AI モデル | 推論に使用されるLLMモデル(例: Granite、Mistral)。 |
| 状況 | ゲートウェイがアクティブ(有効)か非アクティブ(無効)かを示します。 |
| エンドポイントURL | ゲートウェイがAIサービスと通信するための URL エンドポイント。 |
既存のゲートウェイのテスト
LLMゲートウェイを作成したら、接続をテストして正常に動作するか確認できます。
既存のゲートウェイをテストするには、以下の手順を実行してください:
- Instana のUIにあるナビゲーションメニューから、 「AIゲートウェイ」 を選択します。
- 「 LLMゲートウェイ 」テーブルで、テストしたいゲートウェイの 「テスト」 をクリックします。 このテスト結果により、接続が正常に機能しているかどうかがわかります。