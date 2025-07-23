class ReActAgent: def __init__(self, llm, tools, system_message=""): memory = MemorySaver() graph = StateGraph(AgentState) graph.add_node("guardian", self.guardian_moderation) graph.add_node("llm", self.call_llm) graph.add_node("tools", self.call_tools) graph.add_node("block_message", self.block_message) graph.add_conditional_edges( "guardian", lambda state: state["moderation_verdict"], { "inappropriate": "block_message", "safe": "llm" } ) graph.add_edge("block_message", END) graph.add_conditional_edges( "llm", self.should_call_tools, ["tools", END] ) graph.add_edge("tools", "llm") graph.add_edge(START, "guardian") self.system_message = system_message self.graph = graph.compile(checkpointer=memory) self.tools = {t.name: t for t in tools} self.llm = llm.bind_tools(tools)

La prochaine fonction de la classe ReActAgent est call_llm . Cette fonction appelle le LLM en récupérant les messages à partir de l’état. Si un message système est présent, la méthode l’ajoute au début de la liste de messages. Le LLM est alors invoqué avec les messages, et un nouvel état avec une réponse LLM est renvoyé.

def call_llm (self, state : AgentState) : messages = état [« messages »] si self.system_message : messages = [SystemMessage (content=self.system_message)] + messages message = self.llm.invoke(messages) return {'messages': [message]}

call_tools est la prochaine fonction de la classe ReActAgent . Cette méthode récupère les appels d’outils du dernier message de l’état, itère dessus et invoque chaque outil avec les arguments donnés. Ensuite, les résultats de chaque appel d’outil sont stockés dans une liste appelée résultats . Enfin, ce nouvel état est renvoyé sous la forme d’un dictionnaire dans lequel la clé des messages correspond à la liste des résultats.

def call_tools(self, state: AgentState): tool_calls = state['messages'][-1].tool_calls results = [] for t in tool_calls: result = self.tools[t['name']].invoke(t['args']) results.append(ToolMessage(tool_call_id=t['id'], name=t['name'], content=str(result))) return {'messages': results}

La prochaine fonction de la classe ReActAgent est should_call_tools . Cette fonction détermine s’il faut appeler les outils en fonction de l’état en récupérant la réponse précédente du LLM à partir de l’état et en vérifiant si elle contient des appels d’outils.

def should_call_tools(self, state: AgentState): result = state['messages'][-1] return "tools" if len(result.tool_calls) > 0 else END

La fonction guardian_moderation exécutée dans le nœud guardrain est conçue pour modérer les messages à l’aide d’un système gardien, dans le but de détecter et de bloquer tout contenu indésirable ou sensible. Tout d’abord, le dernier message est récupéré. Ensuite, un dictionnaire nommé detectors est défini ; il contient la configuration des détecteurs et leurs valeurs de seuil. Ces détecteurs identifient certains types de contenu dans les messages tels que les données personnelles (PII), ainsi que les discours haineux, les propos injurieux et diffamatoires (HAP). Ensuite, une instance de la classe Guardian est créée, avec un objet api_client nommé client et le dictionnaire detectors . La méthode detect de l’instance Guardian est appelée, transmettant le contenu du dernier message et le dictionnaire detectors . Le méthode renvoie ensuite un dictionnaire dans lequel la clé moderation_verdict stocke une valeur, soit « sûr », soit « inapproprié », selon la sortie du modèle Granite Guardian.

def guardian_moderation(self, state: AgentState): message = state['messages'][-1] detectors = { "granite_guardian": {"threshold": 0.4}, "hap": {"threshold": 0.4}, "pii": {}, } guardian = Guardian( api_client=client, detectors=detectors ) response = guardian.detect( text=message.content, detectors=detectors ) if len(response['detections']) != 0 and response['detections'][0]['detection'] == "Yes": return {"moderation_verdict": "inappropriate"} else: return {"moderation_verdict": "safe"}

La fonction block_message sert de mécanisme de notification, informant l’utilisateur que son entrée (requête) comporte un contenu inapproprié et qu’elle a été bloquée.

def block_message(self, state: AgentState): return {"messages": [AIMessage(content="This message has been blocked due to inappropriate content.")]}

Nous pouvons maintenant assembler tout ce code et exécuter la cellule suivante.

Étape 9. Créer et invoquer l’objet ReActAgent

La première ligne du bloc de code suivant crée une instance de la classe ReActAgent , passant comme paramètres le LLM, les outils SQL et le message système. Ensuite, nous spécifions un thread pour stocker les états du graphe en mémoire. Considérez chaque thread_id comme représentant une nouvelle fenêtre de discussion. Nous pouvons également définir l’entrée utilisateur dans la chaîne de notre choix. Ensuite, nous passons une liste composée de l’entrée utilisateur de type HumanMessage pour invoquer l’agent.

Tout d’abord, essayons un prompt qui devrait être bloqué par le modèle Granite Guardian.

agent = ReActAgent(llm, tools, system_message=system_message) config = {"configurable": {"thread_id": "1"}} user_input = "What is the address of the customer who bought the most expensive car last month?" result = agent.graph.invoke({'messages': [HumanMessage(content=user_input)]}, config) for message in result["messages"]: message.pretty_print()

Sortie :

================================ [1m Human Message [0m================================= What is the address of the customer who bought the most expensive car last month? ================================== [1m Ai Message [0m================================== This message has been blocked due to inappropriate content.

Le modèle Granite Guardian a su empêcher l’utilisateur de demander des informations sensibles sur le client. Nous constatons que le graphe n’a pas atteint le nœud LLM avant de mettre fin à la conversation. Ensuite, posons une question appropriée dans un autre thread. Par exemple, l’entrée utilisateur suivante : « Quel est le chiffre d’affaires total des 5 concessionnaires les plus performants en 2022 ? ».

user_input = "What is the total sales revenue of the 5 best‑performing dealerships in 2022?" config2 = {"configurable": {"thread_id": "2"}} result = agent.graph.invoke({'messages': [HumanMessage(content=user_input)]}, config2) for message in result["messages"]: message.pretty_print()

Sortie :