Monitoraggio di Groq

Modifica online

Groq offre inferenza AI grazie a un'architettura LPU (Language Processing Unit) esclusiva, ottimizzata per garantire prestazioni con una latenza eccezionalmente bassa. Questa guida illustra come strumentare un'applicazione utilizzando i modelli Groq con l' OpenLLMetry, al fine di inviare dati di telemetria a Instana.

Prerequisiti

Assicurati che siano soddisfatti i seguenti prerequisiti:

Python 3.8 o versioni successive
Una chiave dell' API e di Groq (richiedila dalla console di Groq )
Un account Instana
Panoramica sulle modalità con agente e senza agente

Implementazione della strumentazione nell'applicazione Groq

Installa i pacchetti richiesti.
```
pip install groq traceloop-sdk
```

Esporta la tua chiave di Groq API.

export GROQ_API_KEY="<your-groq-api-key>"

Crea la tua applicazione Groq. Crea un file ` Python ` contenente il seguente codice:

import os
from groq import Groq
from traceloop.sdk import Traceloop
from traceloop.sdk.decorators import workflow

# Initialize Groq client
client = Groq(api_key=os.getenv("GROQ_API_KEY"))

# Initialize OpenLLMetry
Traceloop.init(app_name="groq_chat_service", disable_batch=True)

@workflow(name="groq_conversation")
def ask_groq(question: str):
    """Send a question to Groq and get a response."""

    response = client.chat.completions.create(
        max_tokens=512,
        messages=[
            {"role": "user", "content": question}
        ],
        model="llama-3.3-70b-versatile",
    )

    return response.choices[0].message.content

# Example usage
if __name__ == "__main__":
    questions = [
        "What is AIOps and how does it help with IT operations?",
        "Explain the benefits of observability in modern applications."
    ]

    for question in questions:
        print(f"\nQuestion: {question}")
        answer = ask_groq(question)
        print(f"Answer: {answer}\n")
        print("-" * 80)

Esegui la tua applicazione.
```
python3 groq_app.py
```
L'applicazione invierà le domande a Groq e visualizzerà le risposte. OpenLLMetry acquisisce automaticamente le tracce per ogni chiamata all' API e e le invia a Instana.
Visualizza i dati su Instana.

Dopo aver eseguito l'applicazione, nella dashboard di osservabilità di Gen AI di Instana vengono visualizzati i seguenti elementi:
- Modello utilizzato
- Utilizzo dei token (token in entrata e in uscita)
- Latenza di risposta
- Contenuto della richiesta e della risposta

Risoluzione dei problemi

Per problemi comuni, come la mancata visualizzazione delle tracce o errori di connessione, consultare la sezione Risoluzione dei problemi.

Errori di autenticazione

Se si verificano errori di autenticazione:

Verifica che GROQ_API_KEY sia impostato correttamente
Verifica se la tua chiave API è valida nella console Groq
Assicurati che la tua chiave API non sia scaduta o revocata

Errori di limitazione della velocità

Se si verificano errori relativi al limite di richieste:

Controlla i limiti di frequenza del tuo account Groq
Se si effettuano più chiamate, inserire dei ritardi tra una richiesta e l'altra
Ti consigliamo di passare a un piano Groq superiore per usufruire di limiti più elevati
Implementare il backoff esponenziale per i tentativi di riconnessione

Errori relativi a modelli non trovati

Se ricevi messaggi di errore del tipo "Modello non trovato":

Verificare che il nome del modello sia corretto (ad esempio, llama-3.3-70b-versatile)
Verifica se il modello è disponibile su Groq
Per conoscere i modelli disponibili, consultare la documentazione sui modelli di Groq

Passi successivi

Scopri gli altri fornitori di LLM supportati da Instana
Scopri come calcolare i costi relativi al tuo utilizzo di LLM
Imposta degli avvisi per il tuo utilizzo dell' API e Groq
Consulta la documentazione di Groq per i dettagli sull'architettura LPU