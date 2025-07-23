class ReActAgent: def __init__(self, llm, tools, system_message=""): memory = MemorySaver() graph = StateGraph(AgentState) graph.add_node("guardian", self.guardian_moderation) graph.add_node("llm", self.call_llm) graph.add_node("tools", self.call_tools) graph.add_node("block_message", self.block_message) graph.add_conditional_edges( "guardian", lambda state: state["moderation_verdict"], { "inappropriate": "block_message", "safe": "llm" } ) graph.add_edge("block_message", END) graph.add_conditional_edges( "llm", self.should_call_tools, ["tools", END] ) graph.add_edge("tools", "llm") graph.add_edge(START, "guardian") self.system_message = system_message self.graph = graph.compile(checkpointer=memory) self.tools = {t.name: t for t in tools} self.llm = llm.bind_tools(tools)

La siguiente función de la clase ReActAgent es call_llm . Esta función llama al LLM recuperando los mensajes del estado. Si hay un mensaje del sistema, el método lo agrega al principio de la lista de mensajes. Luego se invoca el LLM con los mensajes y se devuelve un nuevo estado con una respuesta del LLM.

def call_llm(self, state: AgentState): messages = state['messages'] if self.system_message: messages = [SystemMessage(content=self.system_message)] + messages message = self.llm.invoke(messages) return {'messages': [message]}

La función call_tools es la siguiente en la clase ReActAgent . Este método recupera las llamadas a herramientas del último mensaje en el estado, las itera e invoca cada herramienta con los argumentos dados. A continuación, los resultados de cada llamada a la herramienta se almacenan en una lista llamada results . Finalmente, este nuevo estado se devuelve en forma de diccionario, donde la clave de mensajes se asigna a la lista de resultados.

def call_tools(self, state: AgentState): tool_calls = state['messages'][-1].tool_calls results = [] for t in tool_calls: result = self.tools[t['name']].invoke(t['args']) results.append(ToolMessage(tool_call_id=t['id'], name=t['name'], content=str(result))) return {'messages': results}

La siguiente función de la clase ReActAgent es should_call_tools . Esta función determina si se debe llamar a las herramientas en función del estado recuperando la respuesta del LLM anterior del estado y comprobando si contiene alguna llamada a la herramienta.

def should_call_tools(self, state: AgentState): result = state['messages'][-1] return "tools" if len(result.tool_calls) > 0 else END

La función guardian_moderation ejecutada en el nodo guardrain está diseñada para moderar mensajes utilizando un sistema guardian, con el propósito de detectar y bloquear contenido no deseado o sensible. Primero, se recupera el último mensaje. A continuación, se define un diccionario denominado detectors , que contiene las configuraciones del detector y sus valores umbral. Estos detectores identifican tipos específicos de contenido en los mensajes, como información de identificación personal (PII), así como lenguaje de odio, lenguaje abusivo y blasfemia (HAP). Luego, se crea una instancia de la clase Guardian, pasando un objeto api_client llamado client y el diccionario detectors . Se llama al método detect de la instancia Guardian, pasando el contenido del último mensaje y el diccionario detectors . Luego, el método devuelve un diccionario en el que la clave moderation_verdict almacena un valor de "seguro" o "inapropiado", dependiendo de la salida del modelo Granite Guardian.

def guardian_moderation(self, state: AgentState): message = state['messages'][-1] detectors = { "granite_guardian": {"threshold": 0.4}, "hap": {"threshold": 0.4}, "pii": {}, } guardian = Guardian( api_client=client, detectors=detectors ) response = guardian.detect( text=message.content, detectors=detectors ) if len(response['detections']) != 0 and response['detections'][0]['detection'] == "Yes": return {"moderation_verdict": "inappropriate"} else: return {"moderation_verdict": "safe"}

La función block_message sirve como mecanismo de notificación, informando al usuario que su consulta de entrada posee contenido inapropiado y ha sido bloqueada.

def block_message(self, state: AgentState): return {"messages": [AIMessage(content="This message has been blocked due to inappropriate content.")]}

Ahora podemos juntar todo este código y ejecutar la siguiente celda.

Paso 9. Crear e invocar el objeto ReActAgent

La primera línea del siguiente bloque de código crea una instancia de la clase ReActAgent , pasando el LLM, las herramientas SQL y el mensaje del sistema como parámetros. A continuación, especificamos un hilo para almacenar los estados del grafo en la memoria. Pensemos en cada thread_id como una nueva ventana de chat. También podemos definir la entrada del usuario a cualquier cadena de elección. A continuación, podemos pasar una lista que consta de la entrada del usuario en el tipo HumanMessage para invocar al agente.

Primero, probemos una instrucción que debería estar bloqueada por el modelo Granite Guardian.

agent = ReActAgent(llm, tools, system_message=system_message) config = {"configurable": {"thread_id": "1"}} user_input = "What is the home address of the customer who purchased the most expensive car last month?" result = agent.graph.invoke({'messages': [HumanMessage(content=user_input)]}, config) for message in result["messages"]: message.pretty_print()

Resultado:

================================ [1m Human Message [0m================================= What is the home address of the customer who purchased the most expensive car last month? ================================== [1m Ai Message [0m================================== This message has been blocked due to inappropriate content.

El modelo Granite Guardian pudo bloquear con éxito al usuario para que no solicitara información confidencial del cliente. Podemos ver que el gráfico no llegó al nodo LLM antes de finalizar la conversación. A continuación, hagamos una pregunta adecuada en un hilo diferente. Por ejemplo, "¿Cuáles son los ingresos totales por ventas de los 5 mejores concesionarios en el año 2022?" como entrada del usuario.

user_input = "What is the total sales revenue for the top 5 performing dealerships in the year 2022?" config2 = {"configurable": {"thread_id": "2"}} result = agent.graph.invoke({'messages': [HumanMessage(content=user_input)]}, config2) for message in result["messages"]: message.pretty_print()

Resultado: