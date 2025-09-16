Abbiamo bisogno di alcune librerie e moduli per questo tutorial. Assicurati di importare i seguenti elementi e, se non sono installati, una rapida installazione tramite pip risolverà il problema.

%pip install --quiet -U langgraph langchain-ibm langgraph_sdk langgraph-prebuilt google-search-results

Riavvia il kernel e importa i seguenti pacchetti.

import getpass

import uuid



from ibm_watsonx_ai import APIClient, Credentials

from ibm_watsonx_ai.foundation_models.moderations import Guardian

from IPython.display import Image, display

from langchain_core.messages import AnyMessage, SystemMessage, HumanMessage, AIMessage

from langchain_ibm import ChatWatsonx

from langgraph.checkpoint.memory import MemorySaver

from langgraph.graph import START, END, StateGraph

from langgraph.graph.message import add_messages

from langgraph.prebuilt import tools_condition, ToolNode

from langgraph.types import interrupt, Command

from serpapi.google_search import GoogleSearch

from typing_extensions import TypedDict

from typing import Annotated

Per impostare le nostre credenziali, abbiamo bisogno del WATSONX_APIKEY e WATSONX_PROJECT_ID che hai generato nel passaggio 1. Imposteremo anche il WATSONX_URL che funga da endpoint API.

Per accedere all'API di Google Patents, abbiamo bisogno anche di un SERPAPI_API_KEY . Puoi generare una chiave gratuita mediante la registrazione al tuo account SerpApi o registrandoti per ottenerne una.

WATSONX_APIKEY = getpass.getpass(“Please enter your watsonx.ai Runtime API key (hit enter): “)

WATSONX_PROJECT_ID = getpass.getpass(“Please enter your project ID (hit enter): “)

WATSONX_URL = getpass.getpass(“Please enter your watsonx.ai API endpoint (hit enter): “)

SERPAPI_API_KEY = getpass.getpass(“Please enter your SerpAPI API key (hit enter): “)

Prima di inizializzare il nostro LLM, possiamo usare la classe Credentials per incapsulare le credenziali API trasmesse.

credentials = Credentials(url=WATSONX_URL, api_key=WATSONX_APIKEY)

Passaggio 4. Istanzia il modello di chat

Per poter interagire con tutte le risorse disponibili in watsonx.ai Runtime, è necessario impostare un APIClient Qui, passiamo le nostre credenziali e WATSONX_PROJECT_ID .

client = APIClient(credentials=credentials, project_id=WATSONX_PROJECT_ID)

Per questo tutorial, utilizzeremo il wrapper ChatWatsonx per impostare il nostro modello di chat. Questo wrapper semplifica l'integrazione della chiamata e del concatenamento degli strumenti. Ti invitiamo a utilizzare i riferimenti all'API nei ChatWatsonx documenti ufficiali per ulteriori informazioni. Possiamo passare a model_id per il Granite LLM e il nostro clienti come parametri.

Nota: se utilizzi un provider API diverso, dovrai modificare il wrapper di conseguenza.

model_id = “ibm/granite-3-3-8b-instruct”

llm = ChatWatsonx(model_id=model_id, watsonx_client=client)

Fase 5. Definisci lo strumento di scraper dei brevetti

Gli agenti AI utilizzano degli strumenti per colmare le lacune informative e restituire informazioni rilevanti. Questi strumenti possono includere ricerca web, RAG, varie API, calcoli matematici e così via. Utilizzando Google Patents Api tramite SerpAPI, possiamo definire uno strumento per lo scraping dei brevetti. Questo strumento è una funzione che prende come argomento il termine di ricerca e restituisce i risultati di ricerca organici per i brevetti correlati. Il wrapper GoogleSearch richiede parametri come il motore di ricerca, che nel nostro caso è google_patents , il termine di ricerca e, infine, lo strumento SERPAPI_API_KEY .

def scrape_patents(search_term: str):

“””Search for patents about the topic.



Args:

search_term: topic to search for

“””

params = {

“engine”: “google_patents”,

“q”: search_term,

“api_key”: SERPAPI_API_KEY

}



search = GoogleSearch(params)

results = search.get_dict()

return results[‘organic_results’]

Successivamente, colleghiamo l'LLM a scrape_patents utilizzando il metodo bind_tools .

tools = [scrape_patents]

llm_with_tools = llm.bind_tools(tools)

Passo 6. Primo approccio HITL: interrupt statici

I grafici degli agenti LangGraph sono composti da nodi e edge. I nodi sono funzioni che trasmettono, aggiornano e restituiscono informazioni. Come possiamo tenere traccia di queste informazioni tra i nodi? Ebbene, i grafici degli agenti richiedono uno stato, che contiene tutte le informazioni rilevanti di cui un agente ha bisogno per prendere decisioni. I nodi sono collegati dagli edge, funzioni che selezionano il nodo successivo da eseguire in base allo stato corrente. Gli edge possono essere condizionali o fissi.

Iniziamo a creare AgentState una classe per memorizzare il contesto dei messaggi dell'utente, degli strumenti e dell'agente stesso. La classe TypedDict di Python viene utilizzata qui per garantire che i messaggi siano nel formato del dizionario appropriato. Possiamo anche usare i modelli di LangGraph add_messages per aggiungere qualsiasi nuovo messaggio all'elenco di messaggi esistente.

class AgentState(TypedDict):

messages: Annotated[list[AnyMessage], add_messages]

Successivamente, definisci la funzione call_llm che costituisce il nodo assistant . Questo nodo richiamerà semplicemente l'LLM con il messaggio corrente dello stato e il messaggio di sistema.

sys_msg = SystemMessage(content=”You are a helpful assistant tasked with prior art search.”)



def call_llm(state: AgentState):

return {“messages”: [llm_with_tools.invoke([sys_msg] + state[“messages”])]

Successivamente, possiamo definire il guardian_moderation che costituisce il nodo guardian . Questo nodo è progettato per moderare i messaggi utilizzando un sistema di protezione, per rilevare e bloccare contenuti indesiderati o sensibili. Innanzitutto, viene recuperato l'ultimo messaggio. Successivamente, viene definito un dizionario denominato detectors che contiene le configurazioni del rilevatore e i relativi valori di soglia. Questi rilevatori identificano tipi specifici di contenuti nei messaggi, come le informazioni di identificazione personale (PII), l'incitamento all'odio, il linguaggio offensivo e il linguaggio blasfemo (HAP). Successivamente, viene creata un'istanza della classe Guardian, passando in un oggetto api_client denominato e nel dizionario client e il detectors . Viene richiamato il metodo detect dell'istanza Guardian, passando il contenuto dell'ultimo messaggio e il dizionario detectors . Il metodo restituisce quindi un dizionario in cui la chiave moderation_verdict La chiave memorizza un valore "sicuro" o "inappropriato", a seconda dell'output del modello Granite Guardian.

def guardian_moderation(state: AgentState):

message = state[‘messages’][-1]

detectors = {

“granite_guardian”: {“threshold”: 0.4},

“hap”: {“threshold”: 0.4},

“pii”: {},

}

guardian = Guardian(

api_client=client,

detectors=detectors

)

response = guardian.detect(

text=message.content,

detectors=detectors

)

if len(response[‘detections’]) != 0 and response[‘detections’][0][‘detection’] == “Yes”:

return {“moderation_verdict”: “inappropriate”}

else:

return {“moderation_verdict”: “safe”}

Ora, definiamo block_message che funge da meccanismo di notifica, informando l'utente che la sua query di input contiene contenuti inappropriati ed è stata bloccata.

def block_message(state: AgentState):

return {“messages”: [AIMessage(content=”This message has been blocked due to inappropriate content.”)]

Ora possiamo mettere insieme tutte queste funzioni aggiungendo i nodi corrispondenti e collegandoli con gli edge che definiscono il flusso del grafico.

Il grafico inizia in corrispondenza del nodo guardian , che chiama il metodo guardian_moderation per rilevare i contenuti dannosi prima che raggiungano l'LLM e l'API. L'edge condizionale tra i nodi guardian e assistant indirizza lo stato del grafico verso il nodo assistant o verso la fine. Questa posizione è determinata dall'output della funzione guardian_moderation . I messaggi sicuri vengono passati al nodo assistant , che esegue il metodo call_llm . Aggiungiamo anche un edge condizionale tra i nodi assistant e tools per instradare i messaggi in modo appropriato. Se l'LLM restituisce una chiamata allo strumento, il metodo tools_condition indirizza al nodo degli strumenti. Altrimenti, il grafico si dirige verso la fine. Questo passaggio fa parte dell'architettura dell'agente ReACT perché vogliamo che l'agente riceva l'output dello strumento e poi reagisca al cambiamento di stato per determinare la sua azione successiva.

builder = StateGraph(AgentState)



builder.add_node(“guardian”, guardian_moderation)

builder.add_node(“block_message”, block_message)

builder.add_node(“assistant”, call_llm)

builder.add_node(“tools”, ToolNode(tools))



builder.add_edge(START, “guardian”)

builder.add_conditional_edges(

“guardian”,

lambda state: state[“moderation_verdict”],

{

“inappropriate”: “block_message”,

“safe”: “assistant”

}

)

builder.add_edge(“block_message”, END)

builder.add_conditional_edges(

“assistant”,

tools_condition,

)

builder.add_edge(“tools”, “assistant”)

memory = MemorySaver()

Successivamente, possiamo compilare il grafico, che ci consente di invocare l'agente in un passaggio successivo. Per rendere persistenti i messaggi, possiamo usare il checkpointer MemorySaver checkpointer. Per implementare il primo approccio di supervisione umana, le interruzioni statiche, possiamo impostare il parametro interrupt_before per il nodo assistant . Ciò significa che, prima che il grafico venga indirizzato all'LLM nel nodo assistant , si verificherà un'interruzione del grafico per consentire all'operatore che supervisiona il workflow agentico di fornire feedback.

graph = builder.compile(interrupt_before=[“assistant”], checkpointer=memory)

Per ottenere una rappresentazione visiva del grafo dell'agente, possiamo visualizzare il flusso del grafo.

display(Image(graph.get_graph(xray=True).draw_mermaid_png()))

Generazione di spiegazioni È stato utile? Sì No

Output