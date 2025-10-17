Cette étape est importante car elle permettra d’obtenir un exemple clair du comportement d’un agent avec et sans sources de données externes. Commençons par définir nos paramètres.

Vous trouverez les paramètres disponibles pour le modèle ici. Nous avons testé divers paramètres de modèle, notamment la température, le nombre minimum et maximum de nouveaux tokens et les séquences d’arrêt. Pour en savoir plus sur les paramètres du modèle et leur signification, consultez la documentation de watsonx. Il est important de définir ici nos stop_sequences afin de limiter les hallucinations d’agents. Cela indique à l’agent de cesser toute production lorsqu’il rencontre certaines sous-chaînes. Dans notre cas, nous voulons que l’agent termine sa réponse lorsqu’il atteint une observation et qu’il n’hallucine pas une réponse humaine. Par conséquent, l’une de nos séquences d’arrêt est ’Human:’ et une autre est Observation pour qu’il s’arrête une fois qu’une réponse finale a été produite.

Pour ce tutoriel, nous vous recommandons d’utiliser le modèle Granite-3.0-8B-Instruct d’IBM comme LLM afin d’obtenir des résultats similaires. Vous pouvez utiliser les modèles IA de votre choix. Vous trouverez les modèles de fondation disponibles avec watsonx ici. Dans le cadre d’une application LLM, ces modèles ont pour objectif de servir de moteur de raisonnement afin de déterminer les actions à entreprendre.

llm = WatsonxLLM(

model_id="ibm/granite-3-8b-instruct",

url=credentials.get("url"),

apikey=credentials.get("apikey"),

project_id=project_id,

params={

GenParams.DECODING_METHOD: "greedy",

GenParams.TEMPERATURE: 0,

GenParams.MIN_NEW_TOKENS: 5,

GenParams.MAX_NEW_TOKENS: 250,

GenParams.STOP_SEQUENCES: ["Human:", "Observation"],

},

)

Nous allons créer un modèle de prompt qui vous permettra de poser plusieurs questions si vous le souhaitez.



template = "Answer the {query} accurately. If you do not know the answer, simply say you do not know."

prompt = PromptTemplate.from_template(template)

Nous pouvons maintenant configurer une chaîne avec notre prompt et notre LLM. Cela permet au modèle génératif de produire une réponse.

agent = prompt | llm

Faisons un test pour voir comment notre agent répond à une question de base.

agent.invoke({"query": 'What sport is played at the US Open?'})

Output: ' Do not try to make up an answer.



The sport played at the US Open is tennis.'

L’agent a répondu avec succès à la requête de base en donnant la bonne réponse. À l’étape suivante de ce tutoriel, nous créerons un outil RAG permettant à l’agent d’accéder aux informations pertinentes sur la participation d’IBM à l’US Open 2024. Comme nous l’avons vu, les LLM traditionnels ne peuvent pas obtenir d’informations actuelles par eux-mêmes. Vérifions cela.

agent.invoke({"query": 'Where was the 2024 US Open Tennis Championship?'})

Output: ' Do not make up an answer.



The 2024 US Open Tennis Championship has not been officially announced yet, so the location is not confirmed. Therefore, I do not know the answer to this question.'

Évidemment, le LLM n’est pas en mesure de nous fournir les informations pertinentes. Les données d’entraînement utilisées pour ce modèle contenaient des informations antérieures à l’US Open 2024 et, sans les outils appropriés, l’agent n’a pas accès à ces informations.