Monitoraggio di Groq
Groq offre inferenza AI grazie a un'architettura LPU (Language Processing Unit) esclusiva, ottimizzata per garantire prestazioni con una latenza eccezionalmente bassa. Questa guida illustra come strumentare un'applicazione utilizzando i modelli Groq con l' OpenLLMetry, al fine di inviare dati di telemetria a Instana.
Prerequisiti
Assicurati che siano soddisfatti i seguenti prerequisiti:
- Python 3.8 o versioni successive
- Una chiave dell' API e di Groq (richiedila dalla console di Groq )
- Un account Instana
Panoramica sulle modalità con agente e senza agente
Implementazione della strumentazione nell'applicazione Groq
Installa i pacchetti richiesti.
pip install groq traceloop-sdk- Esporta la tua chiave di Groq API.
export GROQ_API_KEY="<your-groq-api-key>" Crea la tua applicazione Groq. Crea un file ` Python ` contenente il seguente codice:
import os from groq import Groq from traceloop.sdk import Traceloop from traceloop.sdk.decorators import workflow # Initialize Groq client client = Groq(api_key=os.getenv("GROQ_API_KEY")) # Initialize OpenLLMetry Traceloop.init(app_name="groq_chat_service", disable_batch=True) @workflow(name="groq_conversation") def ask_groq(question: str): """Send a question to Groq and get a response.""" response = client.chat.completions.create( max_tokens=512, messages=[ {"role": "user", "content": question} ], model="llama-3.3-70b-versatile", ) return response.choices[0].message.content # Example usage if __name__ == "__main__": questions = [ "What is AIOps and how does it help with IT operations?", "Explain the benefits of observability in modern applications." ] for question in questions: print(f"\nQuestion: {question}") answer = ask_groq(question) print(f"Answer: {answer}\n") print("-" * 80)Esegui la tua applicazione.
python3 groq_app.pyL'applicazione invierà le domande a Groq e visualizzerà le risposte. OpenLLMetry acquisisce automaticamente le tracce per ogni chiamata all' API e e le invia a Instana.
Visualizza i dati su Instana.
Dopo aver eseguito l'applicazione, nella dashboard di osservabilità di Gen AI di Instana vengono visualizzati i seguenti elementi:
- Modello utilizzato
- Utilizzo dei token (token in entrata e in uscita)
- Latenza di risposta
- Contenuto della richiesta e della risposta
Risoluzione dei problemi
Per problemi comuni, come la mancata visualizzazione delle tracce o errori di connessione, consultare la sezione Risoluzione dei problemi.
Errori di autenticazione
Se si verificano errori di autenticazione:
- Verifica che
GROQ_API_KEYsia impostato correttamente - Verifica se la tua chiave API è valida nella console Groq
- Assicurati che la tua chiave API non sia scaduta o revocata
Errori di limitazione della velocità
Se si verificano errori relativi al limite di richieste:
- Controlla i limiti di frequenza del tuo account Groq
- Se si effettuano più chiamate, inserire dei ritardi tra una richiesta e l'altra
- Ti consigliamo di passare a un piano Groq superiore per usufruire di limiti più elevati
- Implementare il backoff esponenziale per i tentativi di riconnessione
Errori relativi a modelli non trovati
Se ricevi messaggi di errore del tipo "Modello non trovato":
- Verificare che il nome del modello sia corretto (ad esempio,
llama-3.3-70b-versatile) - Verifica se il modello è disponibile su Groq
- Per conoscere i modelli disponibili, consultare la documentazione sui modelli di Groq
Passi successivi
- Scopri gli altri fornitori di LLM supportati da Instana
- Scopri come calcolare i costi relativi al tuo utilizzo di LLM
- Imposta degli avvisi per il tuo utilizzo dell' API e Groq
- Consulta la documentazione di Groq per i dettagli sull'architettura LPU