Creazione di un prodotto personalizzato per un'API " Gemini
Creare un prodotto per un'API 'AI Gateway e aggiungere un piano che contenga i limiti di tasso di assemblaggio richiesti.
Attenzione: Un prodotto creato in un secondo momento con la funzione di pubblicazione automatica (quando si pubblica l'API) non include il piano necessario per l'utilizzo del servizio AI. Se non si è selezionato Crea prodotto per generare un prodotto durante la creazione dell'API 'OpenAI, è necessario creare un prodotto personalizzato prima di poter pubblicare la nuova API.
Creare il prodotto come spiegato in Creazione di una bozza di prodotto. Nella definizione del prodotto, aggiungere un piano con i limiti di tasso di assemblaggio 'gemini-default e 'gemini-token-weighted, come mostrato nell'esempio seguente:
plans:
default-plan:
title: Default Plan
description: Default Plan
approval: false
rate-limits:
default:
value: 100/1minute
assembly-rate-limits:
gemini-default:
- value: 100/1minute
hard-limit: true
cache-only: false
is-client: true
use-api-name: false
use-app-id: false
use-client-id: true
weight: '1'
gemini-token-weighted:
- value: 200/1minute
hard-limit: true
cache-only: false
is-client: true
use-api-name: false
use-app-id: false
use-client-id: true
weight: aiGeneratedTokenCount
- Sono richiesti i limiti di tasso di assemblaggio " Gemini
- Il prodotto deve includere un piano con i limiti tariffari di assemblaggio "
gemini-defaulte "gemini-token-weighted, anche se si aggiungono altri piani al prodotto. È possibile configurare i limiti di velocità in base alle proprie esigenze. - La limitazione della velocità basata sui token richiede un conteggio dei token
- La proprietà '
weight: aiGeneratedTokenCountè richiesta nel limite di tasso di assemblaggio 'gemini-token-weighted. Questa variabile indica il numero di token che verranno aggiunti al contatore a ogni chiamata API e quindi confrontati con la soglia del limite di velocità. - La limitazione delle tariffe può essere applicata al catalogo o ai singoli ID cliente.
- La limitazione della velocità è configurata per il catalogo che contiene l'API. Per impostazione predefinita, a ogni ID cliente che sottoscrive il piano all'interno di un determinato catalogo viene assegnata la propria soglia di velocità. Per configurare una singola soglia per l'intero catalogo, impostare '
use-client-id: falseper quel limite di velocità.