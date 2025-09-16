Nous avons besoin de quelques bibliothèques et modules pour ce tutoriel. Veillez à importer les éléments suivants. S’ils ne sont pas installés, une installation pip résoudra rapidement le problème.

%pip install --quiet -U langgraph langchain-ibm langgraph_sdk langgraph-prebuilt google-search-results

Redémarrez le noyau et importez les paquets suivants.

import getpass

import uuid



from ibm_watsonx_ai import APIClient, Credentials

from ibm_watsonx_ai.foundation_models.moderations import Guardian

from IPython.display import Image, display

from langchain_core.messages import AnyMessage, SystemMessage, HumanMessage, AIMessage

from langchain_ibm import ChatWatsonx

from langgraph.checkpoint.memory import MemorySaver

from langgraph.graph import START, END, StateGraph

from langgraph.graph.message import add_messages

from langgraph.prebuilt import tools_condition, ToolNode

from langgraph.types import interrupt, Command

from serpapi.google_search import GoogleSearch

from typing_extensions import TypedDict

from typing import Annotated

Pour définir nos identifiants, nous avons besoin de l’élément WATSONX_APIKEY et WATSONX_PROJECT_ID que vous avez généré à l’étape 1. Nous allons également définir notre WATSONX_URL pour servir de point de terminaison de l’API.

Pour accéder à l’API Google Brevets, nous avons également besoin d’une SERPAPI_API_KEY . Vous pouvez générer une clé gratuite en vous connectant à votre compte SerpApi ou en vous inscrivant pour en créer une.

WATSONX_APIKEY = getpass.getpass("Please enter your watsonx.ai Runtime API key (hit enter): ")

WATSONX_PROJECT_ID = getpass.getpass("Please enter your project ID (hit enter): ")

WATSONX_URL = getpass.getpass("Please enter your watsonx.ai API endpoint (hit enter): ")

SERPAPI_API_KEY = getpass.getpass("Please enter your SerpAPI API key (hit enter): ")

Avant d’initialiser notre LLM, nous pouvons utiliser la classe Credentials pour encapsuler nos identifiants API passés.

credentials = Credentials(url=WATSONX_URL, api_key=WATSONX_APIKEY)

Étape 4. Instancier le modèle de chat

Pour pouvoir interagir avec toutes les ressources disponibles dans watsonx.ai Runtime, vous devez configurer votre APIClient . Ici, nous transmettons nos identifiants et WATSONX_PROJECT_ID .

client = APIClient(credentials=credentials, project_id=WATSONX_PROJECT_ID)

Pour ce tutoriel, nous utiliserons l’encapsuleur ChatWatsonx pour définir notre modèle de chat. Cet encapsuleur simplifie l’intégration de l’appel et du chaînage des outils. Nous vous encourageons à utiliser les références API dans la documentation ChatWatsonx pour plus d’informations. ChatWatsonx documents officiels pour de plus amples informations. Nous pouvons passer notre model_id pour le LLM Granite et notre client comme paramètres.

Notez que si vous utilisez un autre fournisseur d’API, vous devrez modifier le wrapper en conséquence.

model_id = "ibm/granite-3-3-8b-instruct"

llm = ChatWatsonx(model_id=model_id, watsonx_client=client)

Étape 5. Définir l’outil de scraping de brevets

Les agents IA utilisent des outils pour combler les lacunes d’information et renvoyer des informations pertinentes. Ces outils peuvent inclure la recherche Web, la RAG, diverses API, les calculs mathématiques, etc. En utilisant l’API Google Brevets via SerpAPI, nous pouvons définir un outil de scraping de brevets. Cet outil est une fonction qui prend le terme de recherche comme argument et renvoie les résultats de recherche organique pour les brevets connexes. Le GoogleSearch wrapper exige des paramètres tels que le moteur de recherche, qui dans notre cas est google_patents , le terme de recherche et enfin, SERPAPI_API_KEY .

def scrape_patents(search_term: str):

"""Search for patents about the topic.



Args:

search_term: topic to search for

"""

params = {

"engine": "google_patents",

"q": search_term,

"api_key": SERPAPI_API_KEY

}



search = GoogleSearch(params)

results = search.get_dict()

return results['organic_results']

Ensuite, lions le LLM scrape_patents l’outil en utilisant bind_tools comme méthode.

tools = [scrape_patents]

llm_with_tools = llm.bind_tools(tools)

Étape 6. Première approche HITL : interruptions statiques

Les graphes d’agent LangGraph sont composés de nœuds et d’arêtes. Les nœuds sont des fonctions qui transmettent, mettent à jour et renvoient les informations. Comment suivre ces informations entre les nœuds ? Les graphes d’agents exigent un état, qui contient toutes les informations dont un agent a besoin pour prendre des décisions. Les nœuds sont reliés par des arêtes (les fonctions qui sélectionnent le nœud suivant à exécuter en fonction de l’état actuel). Les arêtes peuvent être conditionnelles ou fixes.

Commençons par créer AgentState une classe pour stocker le contexte des messages provenant de l’utilisateur, des outils et de l’agent. La fonction Python TypedDict est utilisée ici pour garantir que les messages sont au format de dictionnaire approprié. Nous pouvons aussi utiliser add_messages fonction de réduction pour ajouter tout nouveau message à la liste de messages existante.

class AgentState(TypedDict):

messages: Annotated[list[AnyMessage], add_messages]

Définissez ensuite votre call_llm fonction qui constitue assistant le nœud. Ce nœud invoquera simplement le LLM avec le message actuel de l’état et le message système.

sys_msg = SystemMessage(content="You are a helpful assistant tasked with prior art search.")



def call_llm(state: AgentState):

return {"messages": [llm_with_tools.invoke([sys_msg] + state["messages"])]}

Nous pouvons ensuite définir notre guardian_moderation fonction qui constitue guardian nœud. Ce nœud est conçu pour modérer les messages à l’aide d’un système gardien, afin de détecter et de bloquer tout contenu indésirable ou sensible. Tout d’abord, le dernier message est récupéré. Ensuite, un dictionnaire intitulé detectors est défini ; il contient les configurations des détecteurs et leurs valeurs de seuil. Ces détecteurs identifient certains types de contenu dans les messages tels que les données personnelles (PII), ainsi que les propos haineux, injurieux ou diffamatoires (HAP). Ensuite, une instance de la classe Guardian est créée, en transmettant api_client un objet nommé client et le detectors dictionnaire. La méthode detect de l’instance Guardian est appelée, en passant le contenu du dernier message et detectors dictionnaire. La méthode renvoie ensuite un dictionnaire dans lequel moderation_verdict la clé stocke une valeur de type « approprié » ou « inapproprié », en fonction de la sortie du modèle Granite Guardian.

def guardian_moderation(state: AgentState):

message = state['messages'][-1]

detectors = {

"granite_guardian": {"threshold": 0.4},

"hap": {"threshold": 0.4},

"pii": {},

}

guardian = Guardian(

api_client=client,

detectors=detectors

)

response = guardian.detect(

text=message.content,

detectors=detectors

)

if len(response['detections']) != 0 and response['detections'][0]['detection'] == "Yes":

return {"moderation_verdict": "inappropriate"}

else:

return {"moderation_verdict": "safe"}

Maintenant, définissons block_message la fonction pour servir de mécanisme de notification et informer l’utilisateur que sa requête d’entrée contient un contenu inapproprié et a été bloquée.

def block_message(state: AgentState):

return {"messages": [AIMessage(content="This message has been blocked due to inappropriate content.")]}

Nous pouvons maintenant rassembler toutes ces fonctions en ajoutant les nœuds correspondants et en les reliant par les arêtes qui définissent le flux du graphe.

Le graphe commence au guardian nœud qui appelle la méthode guardian_moderation pour détecter les contenus préjudiciables avant qu’ils n’atteignent le LLM et l’API. L’arête conditionnelle entre les guardian et assistant nœuds achemine l’état du graphe vers assistant le nœud ou la fin. Cette position est déterminée par la sortie guardian_moderation de la fonction. Les messages sécurisés sont transmis assistant au nœud, qui exécute call_llm la méthode. Nous ajoutons également une arête conditionnelle entre assistant et tools les nœuds pour acheminer correctement les messages. Si le LLM renvoie un appel d’outil, tools_condition la méthode assure l’acheminement vers le nœud outils. Sinon, le graphe dirige vers la fin. Cette étape fait partie de l’architecture d’agent ReAct, car nous voulons que l’agent reçoive la sortie de l’outil pour ensuite réagir au changement d’état et déterminer sa prochaine action.

builder = StateGraph(AgentState)



builder.add_node("guardian", guardian_moderation)

builder.add_node("block_message", block_message)

builder.add_node("assistant", call_llm)

builder.add_node("tools", ToolNode(tools))



builder.add_edge(START, "guardian")

builder.add_conditional_edges(

"guardian",

lambda state: state["moderation_verdict"],

{

"inappropriate": "block_message",

"safe": "assistant"

}

)

builder.add_edge("block_message", END)

builder.add_conditional_edges(

"assistant",

tools_condition,

)

builder.add_edge("tools", "assistant")

memory = MemorySaver()

Ensuite, nous pouvons compiler le graphe, ce qui nous permet d’appeler l’agent lors d’une étape ultérieure. Pour conserver les messages, nous pouvons utiliser MemorySaver le checkpointer. Pour mettre en œuvre la première approche de supervision humaine, les interruptions statiques, nous pouvons définir interrupt_before le paramètre sur assistant le nœud. Cela signifie qu’avant que le graphique ne soit acheminé vers le LLM dans assistant nœud, une interruption du graphe aura lieu pour permettre à l’humain supervisant le workflow agentique de fournir un feedback.

graph = builder.compile(interrupt_before=["assistant"], checkpointer=memory)

Pour obtenir une représentation visuelle du graphe de l’agent, nous pouvons afficher le flux du graphe.

display(Image(graph.get_graph(xray=True).draw_mermaid_png()))

Output: