Questo passaggio è importante in quanto produrrà un chiaro esempio del comportamento di un agente con e senza fonti di dati esterne. Iniziamo impostando i nostri parametri.

I parametri del modello disponibili possono essere trovati qui. Abbiamo sperimentato vari parametri del modello, tra cui la temperatura, i nuovi token minimi e massimi e le sequenze di arresto. Scopri di più sui parametri del modello e sul loro significato nei documenti watsonx. È importante impostare qui le nostre stop_sequences per limitare le allucinazioni degli agenti. Questo dice all'agente di smettere di produrre ulteriore output quando incontra particolari sottostringhe. Nel nostro caso, vogliamo che l'agente interrompa la sua risposta al raggiungimento di un'osservazione e non allucini una risposta umana. Quindi, una delle nostre stop_sequences è "Human" e un'altra è l'interruzione dell'osservazione una volta prodotta una risposta finale.

Per questo tutorial, consigliamo di utilizzare il modello IBM Granite-3.0-8B-Instruct come LLM per ottenere risultati simili. Puoi utilizzare liberamente il modello AI che preferisci. I modelli di base disponibili tramite watsonx sono disponibili qui. Lo scopo di questi modelli nelle applicazioni LLM è quello di fungere da motore di ragionamento che decide quali azioni intraprendere.

llm = WatsonxLLM(

model_id="ibm/granite-3-8b-instruct",

url=credentials.get("url"),

apikey=credentials.get("apikey"),

project_id=project_id,

params={

GenParams.DECODING_METHOD: "greedy",

GenParams.TEMPERATURE: 0,

GenParams.MIN_NEW_TOKENS: 5,

GenParams.MAX_NEW_TOKENS: 250,

GenParams.STOP_SEQUENCES: ["Human:", "Observation"],

},

)

Imposteremo un template di prompt nel caso in cui desideri fare più domande.



template = "Answer the {query} accurately. If you do not know the answer, simply say you do not know."

prompt = PromptTemplate.from_template(template)

E ora possiamo creare una catena con il nostro prompt e il nostro LLM. Ciò consente al modello generativo di produrre una risposta.

agent = prompt | llm

Facciamo un test per vedere come il nostro agente risponde a una query di base.

agent.invoke({"query": 'What sport is played at the US Open?'})

Output: "Non provare a inventare una risposta.



Lo sport praticato agli US Open è il tennis."

L'agente ha risposto correttamente alla query di base con la risposta corretta. Nella fase successiva di questo tutorial, creeremo uno strumento RAG per consentire all'agente di accedere alle informazioni pertinenti sul coinvolgimento di IBM negli US Open 2024. Come abbiamo visto, i modelli LLM tradizionali non sono in grado di ottenere autonomamente informazioni aggiornate. Verifichiamolo.

agent.invoke({"query": 'Where was the 2024 US Open Tennis Championship?'})

Output: "Non inventare una risposta.



Il campionato di tennis degli US Open 2024 non è stato ancora annunciato ufficialmente, quindi la sede non è confermata. Pertanto, non conosco la risposta a questa domanda".

Evidentemente, l'LLM non è in grado di fornirci le informazioni pertinenti. I dati di allenamento utilizzati per questo modello contenevano informazioni precedenti agli US Open del 2024 e senza gli strumenti appropriati, l'agente non ha accesso a queste informazioni.