Erstellen eines benutzerdefinierten Produkts für eine " Gemini

Legen Sie ein Produkt für eine " AI Gateway an und fügen Sie einen Plan hinzu, der die erforderlichen Montagesatzgrenzen enthält.

Achtung! Ein Produkt, das später mit der Auto-Publishing-Funktion (bei der Veröffentlichung Ihrer API) erstellt wird, enthält nicht den erforderlichen Plan für die Nutzung des KI-Dienstes. Wenn Sie beim Erstellen der API " OpenAI nicht die Option Produkt erstellen gewählt haben, um ein Produkt zu generieren, müssen Sie ein benutzerdefiniertes Produkt erstellen, bevor Sie die neue API veröffentlichen können.

Erstellen Sie das Produkt wie unter „Erstellen eines Produktentwurfs “ beschrieben. Fügen Sie in der Produktdefinition einen Plan mit den Montagesatzgrenzen " gemini-default und " gemini-token-weighted hinzu, wie im folgenden Beispiel gezeigt:

plans:
  default-plan:
    title: Default Plan
    description: Default Plan
    approval: false
    rate-limits:
      default:
        value: 100/1minute
    assembly-rate-limits:
      gemini-default:
        - value: 100/1minute
          hard-limit: true
          cache-only: false
          is-client: true
          use-api-name: false
          use-app-id: false
          use-client-id: true
          weight: '1'
      gemini-token-weighted:
        - value: 200/1minute
          hard-limit: true
          cache-only: false
          is-client: true
          use-api-name: false
          use-app-id: false
          use-client-id: true
          weight: aiGeneratedTokenCount
Die " Gemini für die Montage sind erforderlich
Das Produkt muss einen Tarif mit den Höchstsätzen " gemini-default und " gemini-token-weighted enthalten, auch wenn Sie dem Produkt weitere Tarife hinzufügen. Sie können die Ratenbegrenzungen nach Bedarf für Ihre eigenen Anforderungen konfigurieren.

Token-basierte Ratenbegrenzung erfordert eine Token-Anzahl
Die Eigenschaft " weight: aiGeneratedTokenCount ist für die Baugruppengrenze " gemini-token-weighted erforderlich. Diese Variable gibt die Anzahl der Token an, die bei jedem API-Aufruf zum Zähler hinzugefügt und dann mit dem Schwellenwert für die Ratenbegrenzung verglichen werden.
Die Tarifbegrenzung kann für den Katalog oder für einzelne Kunden-IDs gelten.
Die Ratenbegrenzung wird für den Katalog konfiguriert, der die API enthält. Standardmäßig wird jeder Client-ID, die den Plan innerhalb eines bestimmten Katalogs abonniert, ein eigener Ratengrenzwert zugewiesen. Um einen einzigen Schwellenwert für den gesamten Katalog zu konfigurieren, setzen Sie " use-client-id: false für diesen Ratengrenzwert.