Creazione di un prodotto personalizzato per un'API " Gemini

Creare un prodotto per un'API 'AI Gateway e aggiungere un piano che contenga i limiti di tasso di assemblaggio richiesti.

Attenzione: Un prodotto creato in un secondo momento con la funzione di pubblicazione automatica (quando si pubblica l'API) non include il piano necessario per l'utilizzo del servizio AI. Se non si è selezionato Crea prodotto per generare un prodotto durante la creazione dell'API 'OpenAI, è necessario creare un prodotto personalizzato prima di poter pubblicare la nuova API.

Creare il prodotto come spiegato in Creazione di una bozza di prodotto. Nella definizione del prodotto, aggiungere un piano con i limiti di tasso di assemblaggio 'gemini-default e 'gemini-token-weighted, come mostrato nell'esempio seguente:

plans:
  default-plan:
    title: Default Plan
    description: Default Plan
    approval: false
    rate-limits:
      default:
        value: 100/1minute
    assembly-rate-limits:
      gemini-default:
        - value: 100/1minute
          hard-limit: true
          cache-only: false
          is-client: true
          use-api-name: false
          use-app-id: false
          use-client-id: true
          weight: '1'
      gemini-token-weighted:
        - value: 200/1minute
          hard-limit: true
          cache-only: false
          is-client: true
          use-api-name: false
          use-app-id: false
          use-client-id: true
          weight: aiGeneratedTokenCount
Sono richiesti i limiti di tasso di assemblaggio " Gemini
Il prodotto deve includere un piano con i limiti tariffari di assemblaggio " gemini-default e " gemini-token-weighted, anche se si aggiungono altri piani al prodotto. È possibile configurare i limiti di velocità in base alle proprie esigenze.

La limitazione della velocità basata sui token richiede un conteggio dei token
La proprietà 'weight: aiGeneratedTokenCount è richiesta nel limite di tasso di assemblaggio 'gemini-token-weighted. Questa variabile indica il numero di token che verranno aggiunti al contatore a ogni chiamata API e quindi confrontati con la soglia del limite di velocità.
La limitazione delle tariffe può essere applicata al catalogo o ai singoli ID cliente.
La limitazione della velocità è configurata per il catalogo che contiene l'API. Per impostazione predefinita, a ogni ID cliente che sottoscrive il piano all'interno di un determinato catalogo viene assegnata la propria soglia di velocità. Per configurare una singola soglia per l'intero catalogo, impostare 'use-client-id: false per quel limite di velocità.