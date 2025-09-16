Necesitamos unas pocas bibliotecas y módulos para este tutorial. Asegúrese de importar los siguientes y, si no están instalados, una instalación rápida de pip resuelve el problema.

%pip install --quiet -U langgraph langchain-ibm langgraph_sdk langgraph-prebuilt google-search-results

Reinicie el kernel e importe los siguientes paquetes.

import getpass

import uuid



from ibm_watsonx_ai import APIClient, Credentials

from ibm_watsonx_ai.foundation_models.moderations import Guardian

from IPython.display import Image, display

from langchain_core.messages import AnyMessage, SystemMessage, HumanMessage, AIMessage

from langchain_ibm import ChatWatsonx

from langgraph.checkpoint.memory import MemorySaver

from langgraph.graph import START, END, StateGraph

from langgraph.graph.message import add_messages

from langgraph.prebuilt import tools_condition, ToolNode

from langgraph.types import interrupt, Command

from serpapi.google_search import GoogleSearch

from typing_extensions import TypedDict

from typing import Annotated

Para establecer nuestras credenciales, necesitamos la WATSONX_APIKEY y WATSONX_PROJECT_ID que generó en el paso 1. También estableceremos la WATSONX_URL para servir como endpoint de la API.

Para acceder a la API de patentes de Google, también necesitamos una SERPAPI_API_KEY . Puede generar una clave gratuita iniciando sesión en su cuenta SerpApi o registrándose para obtener una.

WATSONX_APIKEY = getpass.getpass(“Please enter your watsonx.ai Runtime API key (hit enter): “)

WATSONX_PROJECT_ID = getpass.getpass(“Please enter your project ID (hit enter): “)

WATSONX_URL = getpass.getpass(“Please enter your watsonx.ai API endpoint (hit enter): “)

SERPAPI_API_KEY = getpass.getpass(“Please enter your SerpAPI API key (hit enter): “)

Antes de que podamos iniciar nuestro LLM, podemos usar la Credentials para encapsular nuestras credenciales de API pasadas.

credentials = Credentials(url=WATSONX_URL, api_key=WATSONX_APIKEY)

Paso 4. Ejemplificar el modelo de chat

Para poder interactuar con todos los recursos disponibles en watsonx.ai Runtime, debe configurar una APIClient . Aquí, pasamos nuestras credenciales y WATSONX_PROJECT_ID .

client = APIClient(credentials=credentials, project_id=WATSONX_PROJECT_ID)

Para este tutorial, utilizaremos el contenedor ChatWatsonx para configurar nuestro modelo de chat. Este contenedor simplifica la integración de la llamada y el encadenamiento de herramientas. Le animamos a utilizar las referencias de la API en los ChatWatsonx documentos oficiales para más información. Podemos pasar nuestro model_id para Granite LLM y nuestro cliente como parámetros.

Tenga en cuenta que si utiliza un proveedor de API diferente, deberá cambiar el contenedor en consecuencia.

model_id = “ibm/granite-3-3-8b-instruct”

llm = ChatWatsonx(model_id=model_id, watsonx_client=client)

Paso 5. Definir la herramienta de raspado de patentes

Los agentes de IA utilizan herramientas para llenar los vacíos de información y devolver información relevante. Estas herramientas pueden incluir búsqueda web, RAG, varias API, cálculos matemáticos, etc. Con el uso de la API de patentes de Google a través de SerpAPI, podemos definir una herramienta para extraer patentes. Esta herramienta es una función que toma el término de búsqueda como argumento y devuelve los resultados de búsqueda orgánicos para patentes relacionadas. El GoogleSearch contenedor requiere parámetros como el motor de búsqueda, que en nuestro caso es google_patents , el término de búsqueda y, por último, la SERPAPI_API_KEY .

def scrape_patents(search_term: str):

“””Search for patents about the topic.



Args:

search_term: topic to search for

“””

params = {

“engine”: “google_patents”,

“q”: search_term,

“api_key”: SERPAPI_API_KEY

}



search = GoogleSearch(params)

results = search.get_dict()

return results[‘organic_results’]

A continuación, vinculemos el LLM al scrape_patents utilizando el bind_tools método.

tools = [scrape_patents]

llm_with_tools = llm.bind_tools(tools)

Paso 6. Primer enfoque HITL: interrupciones estáticas

Los gráficos de agente LangGraph se componen de nodos y aristas. Los nodos son funciones que transmiten, actualizan y devuelven información. ¿Cómo hacemos un seguimiento de esta información entre nodos? Bueno, los gráficos de agentes requieren un estado, que contenga toda la información relevante que un agente necesita para tomar decisiones. Los nodos están conectados por aristas, que son funciones que seleccionan el siguiente nodo para ejecutar en función del estado actual. Las aristas pueden ser condicionales o fijos.

Empecemos por crear una clase AgentState para almacenar el contexto de los mensajes del usuario, las herramientas y el propio agente. La clase Python TypedDict se utiliza aquí para ayudar a garantizar que los mensajes estén en el formato de diccionario adecuado. También podemos utilizar de LangGraph add_messages la función reductora para añadir cualquier mensaje nuevo a la lista de mensajes existente.

class AgentState(TypedDict):

messages: Annotated[list[AnyMessage], add_messages]

A continuación, defina la función call_llm que conforma el assistant nodo. Este nodo simplemente invocará el LLM con el mensaje actual del estado, así como el mensaje del sistema.

sys_msg = SystemMessage(content=”You are a helpful assistant tasked with prior art search.”)



def call_llm(state: AgentState):

return {“messages”: [llm_with_tools.invoke([sys_msg] + state[“messages”])]

A continuación, podemos definir la guardian_moderation que conforma el guardian nodo. Este nodo está diseñado para moderar los mensajes mediante el uso de un sistema guardián, para detectar y bloquear contenido no deseado o sensible. En primer lugar, se recupera el último mensaje. A continuación, un diccionario llamado detectors que contiene las configuraciones del detector y sus valores umbral. Estos detectores identifican tipos específicos de contenido en los mensajes, como información de identificación personal (PII), así como discurso de odio, lenguaje abusivo y blasfemias (HAP). A continuación, se crea una instancia de la clase Guardian, pasando un api_client objeto llamado client y el detectors diccionario. Se llama al detect método de la instancia de Guardian, pasando el contenido del último mensaje y el detectors diccionario. A continuación, el método devuelve un diccionario en el que moderation_verdict la clave almacena un valor de "safe" o "inappropriate", dependiendo del resultado del modelo de Granite Guardian.

def guardian_moderation(state: AgentState):

message = state[‘messages’][-1]

detectors = {

“granite_guardian”: {“threshold”: 0.4},

“hap”: {“threshold”: 0.4},

“pii”: {},

}

guardian = Guardian(

api_client=client,

detectors=detectors

)

response = guardian.detect(

text=message.content,

detectors=detectors

)

if len(response[‘detections’]) != 0 and response[‘detections’][0][‘detection’] == “Yes”:

return {“moderation_verdict”: “inappropriate”}

else:

return {“moderation_verdict”: “safe”}

Ahora, definamos la block_message para servir como mecanismo de notificación, que informa al usuario de que su consulta de entrada contiene contenido inapropiado y ha sido bloqueada.

def block_message(state: AgentState):

return {“messages”: [AIMessage(content=”This message has been blocked due to inappropriate content.”)]

Ahora podemos juntar todas estas funciones añadiendo los nodos correspondientes y conectándolos con aristas que definen el flujo del gráfico.

El gráfico comienza en el nodo guardian que llama al guardian_moderation para detectar contenido dañino antes de que llegue al LLM y a la API. La arista condicional entre el guardian y assistant nodos enrutan el estado del gráfico al assistant nodo o el final. Esta posición está determinada por la salida de la función guardian_moderation . Los mensajes seguros se pasan al nodo assistant que ejecuta el método call_llm . También añadimos una arista condicional entre el assistant y tools nodos para enrutar los mensajes adecuadamente. Si el LLM devuelve una llamada a la herramienta, el tools_condition se enruta al nodo de herramientas. De lo contrario, el gráfico se dirige al final. Este paso forma parte de la arquitectura del agente ReAct porque queremos que el agente reciba el resultado de la herramienta y luego reaccione al cambio de estado para determinar su próxima acción.

builder = StateGraph(AgentState)



builder.add_node(“guardian”, guardian_moderation)

builder.add_node(“block_message”, block_message)

builder.add_node(“assistant”, call_llm)

builder.add_node(“tools”, ToolNode(tools))



builder.add_edge(START, “guardian”)

builder.add_conditional_edges(

“guardian”,

lambda state: state[“moderation_verdict”],

{

“inappropriate”: “block_message”,

“safe”: “assistant”

}

)

builder.add_edge(“block_message”, END)

builder.add_conditional_edges(

“assistant”,

tools_condition,

)

builder.add_edge(“tools”, “assistant”)

memory = MemorySaver()

A continuación, podemos compilar el gráfico, lo que nos permite invocar al agente en un paso posterior. Para conservar los mensajes, podemos usar el MemorySaver checkpointer. Para implementar el primer enfoque de supervisión humana, las interrupciones estáticas, podemos establecer el interrupt_before parámetro al assistant nodo. Esto significa que antes de que el gráfico se dirija al LLM en el assistant nodo, se producirá una interrupción del gráfico para permitir que el humano que supervisa el flujo de trabajo agéntico proporcione feedback.

graph = builder.compile(interrupt_before=[“assistant”], checkpointer=memory)

Para obtener una representación visual del gráfico del agente, podemos mostrar el flujo del gráfico.

display(Image(graph.get_graph(xray=True).draw_mermaid_png()))

