AIゲートウェイ

オンラインで編集

Instana watsonx.ai やその他の外部LLMサービスへの接続を LLMゲートウェイでサポートし、様々な生成AI（gen AI）ユースケースを実現します。 LLMゲートウェイを設定することで、 Instana の生成AI機能を駆動する接続とLLMを制御し、内部ポリシー、パフォーマンス要件、データガバナンス基準との整合性を確保できます。環境内のすべてのLLMゲートウェイを作成、監視、設定、および保守できます。

デプロイメント・オプション
- SaaS
- 自己ホスティング
サポート対象のLLMサービス
サポート対象のLLM
生成AI機能
ユーザー許可の管理
Instana をLLMゲートウェイに接続する
LLMゲートウェイの表示

デプロイメント・オプション

オンラインで編集

SaaS

オンラインで編集

SaaS 環境では、 Instana がデフォルトのLLMゲートウェイを提供し、追加設定なしで watsonx.ai に自動接続してLLMを活用します。さらに、独自の watsonx.ai ランタイムに接続するためのLLMゲートウェイを作成できます。

自己ホスティング

オンラインで編集

セルフホスト環境（Standard エディションまたは Custom エディション）では、独自の watsonx.ai ランタイムまたは vLLM-based の推論サービスに接続できます。

機能フラグの有効化

オンラインで編集

セルフホスト型 Instana 環境でAIゲートウェイ機能を利用するには、AIゲートウェイの機能フラグを有効にする必要があります。

セルフホスト型 Standard Edition におけるAIゲートウェイの機能フラグを設定するには、「 Standard Edition のオプション機能の有効化」を参照してください。

セルフホスト型カスタムエディション（ Kubernetes または Red Hat OpenShift Container Platform ）で AI ゲートウェイの機能フラグを設定するには、「カスタムエディションでのオプション機能の有効化」を参照してください。

サポート対象のLLMサービス

オンラインで編集

以下のLLMサービスに対してLLMゲートウェイを作成できます：

watsonx.ai (IBM Cloud)
watsonx.ai （ OpenShift 上でセルフホスティングし、データには Cloud Pak を使用（ Instana のバージョン 1.0.313 以降））
vLLM-compatible 推論サービス（ Red Hat AI Inferencing Server (RHAIIS) を含む）（パブリックプレビュー）

サポート対象のLLM

オンラインで編集

生成AI機能は以下の大規模言語モデル（LLM）によってサポートされています

生成AI機能

オンラインで編集

Instana でサポートされている生成AI機能のうち、LLMゲートウェイとの連携設定が可能なものは以下の通りです：

AI アシスタント
インシデントの要約
インシデント調査
Kubernetes AIアシスタント
手動アクション生成
スクリプト生成
SLOアシスタント

ユーザー許可の管理

オンラインで編集

Instana のUIでジェネレーティブAIの全機能を利用するには、以下のユーザー権限が必要です：

AIゲートウェイへのアクセス：AIゲートウェイのUIへの読み取り専用アクセスを有効にします
LLMゲートウェイの作成、設定、削除：AIゲートウェイのUIへのフルアクセスを有効にします
すべてのジェネレーティブAI機能を利用可能： Instana のUIからAIを活用した機能にアクセスできるようになります

詳細については、「ユーザーアクセスの管理」を参照してください。

Instana をLLMゲートウェイに接続する

オンラインで編集

LLMゲートウェイを設定および構成するには、次の手順を完了してください。

接続を設定する。
1. ナビゲーションペインで 「AIゲートウェイ」 をクリックします。 LLMゲートウェイのペインが表示されます。
2. LLMゲートウェイを作成をクリックしてください。 LLMゲ ートウェイ作成ウィザードが表示されます。
3. 接続を設定するを選択してください。
4. 接続設定で、LLMゲートウェイへのアクセスに使用する以下のサービスのいずれかを選択してください：
  - IBM watsonx : watsonx を設定する場合は、以下の詳細を入力してください：
    - watsonx API キー : watsonx サービスへのアクセス認証用 API キー。
    - watsonx プロジェクト名 ：プロジェクトの名称。
    - watsonxURL : watsonx サービス向けの URL。
  - vLLM ：外部の vLLM-based （仮想大規模言語モデル）サービスを設定する場合は、以下の詳細を入力してください：
    - エンドポイント URL : vLLM サービスがホストされている URL。
    - エンドポイントの API キー（任意） ：エンドポイントに安全にアクセスするための認証キー。
5. 設定を確認するには、「接続テスト」をクリックしてください。
  - IBM watsonx について：接続に失敗した場合は、 API キー、プロジェクト ID、および URL が正しく、有効であることを確認してください。テストが成功したことは、 Instana が watsonx サービスと通信できることを確認するものです。
  - vLLM の場合：接続に失敗した場合は、エンドポイント URL にアクセスできること、および API のキーが正しいことを確認してください。テストが成功したことは、 Instana が vLLM サービスと通信できることを確認するものです。
6. 次へをクリックします。
注：vLLM サービスでは、 Kubernetes のAIアシスタント機能はサポートされていません。
機能とAIモデルを選択してください。
1. 「 機能とAIモデルの選択」セクションで、以下の機能のいずれかを選択してください：
  - AI アシスタント
  - 手動アクション生成
  - インシデントの要約
  - インシデント調査
  - スクリプト生成
  - SLOアシスタント
2. AIモデルを選択してください：
  - Granite ：汎用モデル
  - ミストラル（中級）：バランスの取れた性能
  - ミストラル（大型）：複雑なタスクに対応する高容量
  - Openai/gpt-oss-120b: 分析や洞察が必要な業務において。（SLOアシスタントには openai/gpt-oss-120b モデルが必要です）
3. 「次へ」をクリックして続行します。
モデルを設定する。
1. モデルの動作を微調整するには、以下のパラメータを設定してください：
  - トークン制限（単位：千） ：リクエストごとの最大トークン数（例： 100）。
  - 最大遅延時間 ：応答時間の最大値（例： 1 秒）。
  - 反復ペナルティ ：反復されるフレーズを抑制する（例： 1）。
  - 温度 : ランダム性を制御します（例: 0.2 からまで 1）。
  - top_k : サンプリングするトークンの数（例: 50）。
  - top_p : 累積確率のしきい値（例: 0.5）。
2. 次へをクリックして進むか、戻るをクリックして修正してください。
ゲートウェイの詳細を入力してください。
1. 名前 : ゲートウェイに固有の名前を入力してください。
2. 説明 : ゲートウェイの説明を入力してください。
「作成」 をクリックして設定を完了してください。

LLMゲートウェイの表示

オンラインで編集

設定済みのLLMゲートウェイを確認するには、ナビゲーションペインで 「AIゲートウェイ」 をクリックします。 LLM ゲートウェイテーブルが表示され、設定済みの全ゲートウェイとそのステータスが表示されます。それらを有効化または無効化し、設定の詳細を確認できます。


パラメーター	説明
名前	ゲートウェイ設定の名前。各ゲートウェイは特定の汎用AIユースケースに対応します。
機能	ゲートウェイがサポートするジェネレーション AI function （例：スクリプト生成、アクション生成、インシデント要約）。
タイプ	ゲートウェイがデフォルトのシステム構成であるか、ユーザー定義であるかを示します。
使用サービス	ゲートウェイを駆動するLLMサービス（例： IBM、 watsonx ）。
AI モデル	推論に使用されるLLMモデル（例： Granite、Mistral）。
状況	ゲートウェイがアクティブ（有効）か非アクティブ（無効）かを示します。
エンドポイントURL	ゲートウェイがAIサービスと通信するための URL エンドポイント。

既存のゲートウェイのテスト

オンラインで編集

LLMゲートウェイを作成したら、接続をテストして正常に動作するか確認できます。

既存のゲートウェイをテストするには、以下の手順を実行してください：

Instana のUIにあるナビゲーションメニューから、「AIゲートウェイ」を選択します。
「 LLMゲートウェイ」テーブルで、テストしたいゲートウェイの「テスト」をクリックします。このテスト結果により、接続が正常に機能しているかどうかがわかります。