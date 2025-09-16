Necesitamos algunas bibliotecas y módulos para este tutorial. Asegúrese de importar los siguientes y, si no están instalados, una instalación rápida de pip resuelve el problema.

%pip install --quiet -U langgraph langchain-ibm langgraph_sdk langgraph-prebuilt google-search-results

Reinicie el kernel e importe los siguientes paquetes.

import getpass

import uuid



from ibm_watsonx_ai import APIClient, Credentials

from ibm_watsonx_ai.foundation_models.moderations import Guardian

from IPython.display import Image, display

from langchain_core.messages import AnyMessage, SystemMessage, HumanMessage, AIMessage

from langchain_ibm import ChatWatsonx

from langgraph.checkpoint.memory import MemorySaver

from langgraph.graph import START, END, StateGraph

from langgraph.graph.message import add_messages

from langgraph.prebuilt import tools_condition, ToolNode

from langgraph.types import interrupt, Command

from serpapi.google_search import GoogleSearch

from typing_extensions import TypedDict

from typing import Annotated

Para establecer nuestras credenciales, necesitamos el WATSONX_APIKEY y WATSONX_PROJECT_ID que generó en el paso 1. También estableceremos el WATSONX_URL para servir como endpoint de la API.

Para acceder a la API de Google Patents, también necesitamos un SERPAPI_API_KEY Puede generar una clave gratuita mediante el registro en su cuenta de SerpApi o registrándose para obtener una.

WATSONX_APIKEY = getpass.getpass(“Please enter your watsonx.ai Runtime API key (hit enter): “)

WATSONX_PROJECT_ID = getpass.getpass(“Please enter your project ID (hit enter): “)

WATSONX_URL = getpass.getpass(“Please enter your watsonx.ai API endpoint (hit enter): “)

SERPAPI_API_KEY = getpass.getpass(“Please enter your SerpAPI API key (hit enter): “)

Antes de que podamos inicializar nuestro LLM, podemos usar la Credentials clase para encapsular nuestras credenciales de API pasadas.

credentials = Credentials(url=WATSONX_URL, api_key=WATSONX_APIKEY)

Paso 4. Crear una instancia del modelo de chat

Para poder interactuar con todos los recursos disponibles en watsonx.ai Runtime, debe configurar un APIClient . Aquí, pasamos nuestras credenciales y WATSONX_PROJECT_ID .

client = APIClient(credentials=credentials, project_id=WATSONX_PROJECT_ID)

Para este tutorial, usaremos el contenedor ChatWatsonx para configurar nuestro modelo de chat. Este contenedor simplifica la integración de la llamada y el encadenamiento de herramientas. Le recomendamos que utilice las referencias de API en los ChatWatsonx Documentos oficiales para más información. Podemos pasar en nuestro model_id para el LLM Granite y nuestro cliente como parámetros.

Tenga en cuenta que, si utiliza un proveedor de API diferente, deberá cambiar el contenedor en consecuencia.

model_id = “ibm/granite-3-3-8b-instruct”

llm = ChatWatsonx(model_id=model_id, watsonx_client=client)

Paso 5. Definir la herramienta de extracción de patentes

Los agentes de IA utilizan herramientas para llenar los vacíos de información y devolver información relevante. Estas herramientas pueden incluir búsqueda web, RAG, varias API, cálculos matemáticos, etc. Con el uso de Google Patents Api a través de SerpAPI, podemos definir una herramienta para extraer patentes. Esta herramienta es una función que toma el término de búsqueda como argumento y devuelve los resultados de búsqueda orgánicos para patentes relacionadas. El GoogleSearch contenedor requiere parámetros como el motor de búsqueda, que en nuestro caso es google_patents , el término de búsqueda y, por último, el SERPAPI_API_KEY .

def scrape_patents(search_term: str):

“””Search for patents about the topic.



Args:

search_term: topic to search for

“””

params = {

“engine”: “google_patents”,

“q”: search_term,

“api_key”: SERPAPI_API_KEY

}



search = GoogleSearch(params)

results = search.get_dict()

return results[‘organic_results’]

A continuación, vinculemos el LLM al scrape_patents herramienta con el bind_tools método.

tools = [scrape_patents]

llm_with_tools = llm.bind_tools(tools)

Paso 6. Primer enfoque HITL: interrupciones estáticas

Los gráficos de agentes de LangGraph se componen de nodos y bordes. Los nodos son funciones que transmiten, actualizan y devuelven información. ¿Cómo hacemos un seguimiento de esta información entre nodos? Los gráficos de agentes requieren un estado que contenga toda la información relevante que un agente necesita para tomar decisiones. Los nodos están conectados por bordes, que son funciones que seleccionan el siguiente nodo para ejecutarse en función del estado actual. Los bordes pueden ser condicionales o fijos.

Comencemos con la creación de un AgentState class para almacenar el contexto de los mensajes del usuario, las herramientas y el propio agente. Python TypedDict class se utiliza aquí para ayudar a garantizar que los mensajes estén en el formato de diccionario adecuado. También podemos usar LangGraph add_messages para agregar cualquier mensaje nuevo a la lista existente de mensajes.

class AgentState(TypedDict):

messages: Annotated[list[AnyMessage], add_messages]

A continuación, defina la call_llm función que conforma el assistant nodo. Este nodo simplemente invocará el LLM con el mensaje actual del estado, así como el mensaje del sistema.

sys_msg = SystemMessage(content=”You are a helpful assistant tasked with prior art search.”)



def call_llm(state: AgentState):

return {“messages”: [llm_with_tools.invoke([sys_msg] + state[“messages”])]

A continuación, podemos definir el guardian_moderation función que conforma el guardian nodo. Este nodo está diseñado para moderar los mensajes mediante el uso de un sistema guardian, para detectar y bloquear contenido no deseado o confidencial. Primero, se recupera el último mensaje. A continuación, un diccionario llamado detectors que contiene las configuraciones del detector y sus valores de umbral. Estos detectores identifican tipos específicos de contenido en los mensajes, como información de identificación personal (PII), así como discurso de odio, lenguaje abusivo y blasfemias (HAP). Luego, se crea una instancia de la clase Guardian, pasando un api_client objeto llamado client y el detectors diccionario. Se llama al detect método de la instancia de Guardian, pasando el contenido del último mensaje y el detectors diccionario. Luego, el método devuelve un diccionario en el que la moderation_verdict key almacena un valor de “seguro” o “inapropiado”, dependiendo de la salida del modelo Granite Guardian.

def guardian_moderation(state: AgentState):

message = state[‘messages’][-1]

detectors = {

“granite_guardian”: {“threshold”: 0.4},

“hap”: {“threshold”: 0.4},

“pii”: {},

}

guardian = Guardian(

api_client=client,

detectors=detectors

)

response = guardian.detect(

text=message.content,

detectors=detectors

)

if len(response[‘detections’]) != 0 and response[‘detections’][0][‘detection’] == “Yes”:

return {“moderation_verdict”: “inappropriate”}

else:

return {“moderation_verdict”: “safe”}

Ahora, vamos a definir el block_message función para servir como mecanismo de notificación, informando al usuario que su consulta de entrada tiene contenido inapropiado y ha sido bloqueada.

def block_message(state: AgentState):

return {“messages”: [AIMessage(content=”This message has been blocked due to inappropriate content.”)]

Ahora podemos juntar todas estas funciones agregando los nodos correspondientes y conectándolos con bordes que definen el flujo del gráfico.

El gráfico comienza en el guardian nodo, que llama al guardian_moderation método para detectar contenido dañino antes de que llegue al LLM y a la API. El borde condicional entre los guardian y assistant nodos enruta el estado del gráfico al assistant nodo o el final. Esta posición está determinada por la salida de la guardian_moderation función. Los mensajes seguros se pasan al assistant nodo, que ejecuta el call_llm método. También agregamos un borde condicional entre los assistant y tools nodos para enrutar los mensajes adecuadamente. Si el LLM devuelve una llamada a la herramienta, el tools_condition método enruta al nodo de herramientas. De lo contrario, el gráfico se enruta hasta el final. Este paso es parte de la arquitectura del agente ReAct porque queremos que el agente reciba la salida de la herramienta y luego reaccione al cambio de estado para determinar su próxima acción.

builder = StateGraph(AgentState)



builder.add_node(“guardian”, guardian_moderation)

builder.add_node(“block_message”, block_message)

builder.add_node(“assistant”, call_llm)

builder.add_node(“tools”, ToolNode(tools))



builder.add_edge(START, “guardian”)

builder.add_conditional_edges(

“guardian”,

lambda state: state[“moderation_verdict”],

{

“inappropriate”: “block_message”,

“safe”: “assistant”

}

)

builder.add_edge(“block_message”, END)

builder.add_conditional_edges(

“assistant”,

tools_condition,

)

builder.add_edge(“tools”, “assistant”)

memory = MemorySaver()

A continuación, podemos compilar el gráfico, lo que nos permite invocar al agente en un paso posterior. Para conservar los mensajes, podemos usar el MemorySaver punto de control. Para implementar el primer enfoque de supervisión humana, interrupciones estáticas, podemos establecer el interrupt_before parámetro al assistant nodo. Esto significa que antes de que el gráfico se dirija al LLM en el assistant nodo, se producirá una interrupción del gráfico para permitir que el humano que supervisa el flujo de trabajo agéntico proporcione feedback.

graph = builder.compile(interrupt_before=[“assistant”], checkpointer=memory)

Para obtener una representación visual del gráfico del agente, podemos mostrar el flujo del gráfico.

display(Image(graph.get_graph(xray=True).draw_mermaid_png()))

