Gemini の REST プロキシを作成する。 AI Gateway

AIモデルへのアクセスを制御するために'AI Gateway使用するRESTプロキシを作成する。

開始前に

AI Gateway使用するための前提条件」のタスクを完了し、'Geminiにアクセスできるようにする。

このタスクについて

AI GatewayはOpenAPI 3.0API でのみサポートされています。

手順

  1. ナビゲーション ペインで、をクリックします 開発アイコン

  2. 開発 」ページで、 「追加 」>「 API 」をクリックします。

  3. Select API typeページで、OpenAPI 3.0タブをクリックします。

  4. 作成セクションで「AIゲートウェイ選択し、「次のページクリックする。

  5. Create API from AI gateway ページで、 Platform フィールドを使用して、新しいAPIが使用するAIサービスとして Google Geminiを選択する。

  6. Info "セクションでAPIに関する基本情報を入力し、"Next "をクリックする:
    Draft comment: abeesh.thomas@ibm.com
    From this step on, the info was copied from OpenAI so it needs updating for Genini.
    • OpenAPI のバージョンは、ステップ3で OpenAPI をクリックした選択に基づいている。 3.0

    • タイトル :タイトルには特殊文字を含めることができますが、ユーザーインターフェイスで簡単に表示できるように短くする必要があります。

    • タイトルをもとに名前が記入される。 この値は、開発者ツールキットのCLIコマンドでAPIを識別するために使用される単一の文字列である。

    • バージョン:デフォルト値を受け入れるか、必要に応じて変更する。 バージョンは、OpenAPI定義の「info.versionプロパティの値に対応する。 バージョン番号の付け方は version.release.modification を推奨する。例えば、 1.0.0

    • ベースパス:デフォルト値を受け入れるか、必要に応じて変更する。 APIの "ベースパス "はサーバーの URL、APIが公開されているカタログのバニティエンドポイント構成を考慮して、APIを呼び出すための完全な URL エンドポイントを決定するために使用される。 DataPower® API Gateway によって強制される API については、ベースパスの値のみを提供する必要があります。 さらに、
      • ホスト名や、パスや操作のための追加セグメントを含めないでください
      • 特殊文字を含めない
      • URL をスラッシュ ( / ) で開始する。たとえ中身が空であっても

    • 説明:オプションの説明は、APIを識別するのに役立ちます。
  7. API キー値、または API キーを値とする $(カタログ・プロパティの名前) 変数のいずれかを入力し、 Next をクリックします。 API キーにより、API は Google Studio で認証され、 Gemini サービスへのアクセスに必要となる。
  8. APIがリクエストを送信するために「Geminiアクセスする方法に関する情報を入力し、[Create]をクリックする:
    • 公開パス:公開パスのデフォルト・リストを受け入れるか、APIにアクセスさせたいパスだけを選択する。 公開されるパスは、生成されるAPIにどの「Gemini操作が含まれるかを定義する。

    • レスポンス・キャッシュの有効化 :レスポンス・キャッシュは、APIのパフォーマンスを最適化するためにデフォルトで有効になっています。 レスポンスキャッシュを使用する場合、ポリシー UI の Response Cache Expiration プロパティでキャッシュの期間を指定できます。

      レスポンスキャッシュが有効になっている場合、リクエストが「Geminiサービ スに送られると、リクエストペイロードに関連するキャッシュされたレスポンスが あるかどうかを判断するために、レスポンスキャッシュが検査される。 もしそうであれば、その応答と関連する HTTP 応答ヘッダーは、 DataPower API Gateway コンテキストメッセージ(デフォルトでは message という名前)に配置されます。 別のメッセージが必要な場合は、API 生成後にポリシー UI のOutput Messageプロパティを変更できます。

      キャッシュされた応答がない場合、リクエストは Gemini サービスに渡され、応答は、 Response Cache Expiration プロパティで指定された有効期限を使用して、以降の操作のためにキャッシュされる。

      レスポンスキャッシュを有効にする場合は、ポリシー UI の [ レスポンスキャッシュの有効期限] フィールドで、デフォルト値を受け入れるか、新しい値を選択 (または入力) して、キャッシュの期間を設定します。 最小継続時間は60秒で、最大継続時間は86400秒(1日)である。この範囲外の値は、このフィールドで値が受け入れられたとしても、API公開時に検証に失敗する。
    • Rate Limiting] セクションで、APIのレート制限を制御する「API Connect製品を生成する場合は、[Create product] を選択します。

      API Connect」では、製品はAPIとそれに関連する利用プランのコンテナとして機能する。 ここで製品レート制限を設定すると、必要な「gemini-default」と「gemini-token-weightedアセンブリレート制限を含むプランが作成され、定義した制限が指定されます。

      製品を自動生成しない場合は、「 AI Gateway を使用した Gemini の REST プロキシの作成 」の手順に従って、製品を作成する必要があります。

      ご注意自動公開機能(API公開時)を利用して後から作成された商品には、AIサービスを利用するために必要なプランは含まれていません。 今すぐ製品を作成するか、APIを公開する前にカスタム製品を作成してください

      APIコールに適用するレート制限のタイプを設定します:

      注:レートリミットの値を指定しないことを選択した場合、そのレートリミットのデフォルト値が割り当てられる。
      • Set rate limit : (Time based) デフォルトのレート制限を受け入れるか、指定期間内に送信されたAPIリクエスト数に基づいて新しい制限を設定します。 このタイプのレート制限はトークンを使用しない。

      • Set AI token limit : (Token based) デフォルトのレート制限を受け入れるか、指定期間内に使用されたコストベースのトークン数に基づいて新しい制限を設定する。 トークン・ベースのレート制限は、トークンの使用量を追跡するために「/chat/completionsオペレーションを使用する。

        AIトークン・リミットは、トークンの使用量に基づいてレート制限を適用する。 レート・リミットは、指定された期間内にゲートウェイを通過できるトークンの数を決定する。

  9. Summaryページを見て、APIに問題がないことを確認する。

  10. 新しいAPIを編集し、APIのワークフローを制御するポリシーとロジックを追加する。

    作成されたAPIには、リクエストされた公開パスの Gemini invokeポリシーが含まれている。 そのプロパティは必要に応じて編集できる。