Erstellen eines benutzerdefinierten Produkts für eine " Gemini
Legen Sie ein Produkt für eine " AI Gateway an und fügen Sie einen Plan hinzu, der die erforderlichen Montagesatzgrenzen enthält.
Achtung! Ein Produkt, das später mit der Auto-Publishing-Funktion (bei der Veröffentlichung Ihrer API) erstellt wird, enthält nicht den erforderlichen Plan für die Nutzung des KI-Dienstes. Wenn Sie beim Erstellen der API " OpenAI nicht die Option Produkt erstellen gewählt haben, um ein Produkt zu generieren, müssen Sie ein benutzerdefiniertes Produkt erstellen, bevor Sie die neue API veröffentlichen können.
Erstellen Sie das Produkt wie unter „Erstellen eines Produktentwurfs “ beschrieben. Fügen Sie in der Produktdefinition einen Plan mit den Montagesatzgrenzen " gemini-default und " gemini-token-weighted hinzu, wie im folgenden Beispiel gezeigt:
plans:
default-plan:
title: Default Plan
description: Default Plan
approval: false
rate-limits:
default:
value: 100/1minute
assembly-rate-limits:
gemini-default:
- value: 100/1minute
hard-limit: true
cache-only: false
is-client: true
use-api-name: false
use-app-id: false
use-client-id: true
weight: '1'
gemini-token-weighted:
- value: 200/1minute
hard-limit: true
cache-only: false
is-client: true
use-api-name: false
use-app-id: false
use-client-id: true
weight: aiGeneratedTokenCount
- Die " Gemini für die Montage sind erforderlich
- Das Produkt muss einen Tarif mit den Höchstsätzen "
gemini-defaultund "gemini-token-weightedenthalten, auch wenn Sie dem Produkt weitere Tarife hinzufügen. Sie können die Ratenbegrenzungen nach Bedarf für Ihre eigenen Anforderungen konfigurieren. - Token-basierte Ratenbegrenzung erfordert eine Token-Anzahl
- Die Eigenschaft "
weight: aiGeneratedTokenCountist für die Baugruppengrenze "gemini-token-weightederforderlich. Diese Variable gibt die Anzahl der Token an, die bei jedem API-Aufruf zum Zähler hinzugefügt und dann mit dem Schwellenwert für die Ratenbegrenzung verglichen werden. - Die Tarifbegrenzung kann für den Katalog oder für einzelne Kunden-IDs gelten.
- Die Ratenbegrenzung wird für den Katalog konfiguriert, der die API enthält. Standardmäßig wird jeder Client-ID, die den Plan innerhalb eines bestimmten Katalogs abonniert, ein eigener Ratengrenzwert zugewiesen. Um einen einzigen Schwellenwert für den gesamten Katalog zu konfigurieren, setzen Sie "
use-client-id: falsefür diesen Ratengrenzwert.