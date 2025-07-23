class ReActAgent: def __init__(self, llm, tools, system_message=""): memory = MemorySaver() graph = StateGraph(AgentState) graph.add_node("guardian", self.guardian_moderation) graph.add_node("llm", self.call_llm) graph.add_node("tools", self.call_tools) graph.add_node("block_message", self.block_message) graph.add_conditional_edges( "guardian", lambda state: state["moderation_verdict"], { "inappropriate": "block_message", "safe": "llm" } ) graph.add_edge("block_message", END) graph.add_conditional_edges( "llm", self.should_call_tools, ["tools", END] ) graph.add_edge("tools", "llm") graph.add_edge(START, "guardian") self.system_message = system_message self.graph = graph.compile(checkpointer=memory) self.tools = {t.name: t for t in tools} self.llm = llm.bind_tools(tools)

ReActAgent 클래스의 다음 함수는 call_llm 입니다. 이 함수는 상태에서 메시지를 가져와 LLM을 호출합니다. 시스템 메시지가 있는 경우, 이 메서드는 이를 메시지 목록의 맨 앞에 추가합니다. 그런 다음 메시지와 함께 LLM이 호출되며, LLM 응답이 포함된 새로운 상태가 반환됩니다.

def call_llm(self, state: AgentState): messages = state['messages'] if self.system_message: messages = [SystemMessage(content=self.system_message)] + messages message = self.llm.invoke(messages) return {'messages': [message]}

ReActAgent 클래스의 다음 함수는 call_tools 입니다. 이 메서드는 상태의 마지막 메시지에서 툴 호출을 가져와 반복 처리하며, 주어진 인수로 각 툴을 호출합니다. 다음으로 각 툴 호출의 결과는 results 라는 리스트에 저장됩니다. 마지막으로 messages 키가 results 리스트에 매핑된 딕셔너리 형태로 새로운 상태가 반환됩니다.

def call_tools(self, state: AgentState): tool_calls = state['messages'][-1].tool_calls results = [] for t in tool_calls: result = self.tools[t['name']].invoke(t['args']) results.append(ToolMessage(tool_call_id=t['id'], name=t['name'], content=str(result))) return {'messages': results}

ReActAgent 클래스의 다음 함수는 should_call_tools 입니다. 이 함수는 상태에서 이전 LLM 응답을 가져와 툴 호출이 포함되어 있는지 확인함으로써 툴을 호출할지 여부를 결정합니다.

def should_call_tools(self, state: AgentState): result = state['messages'][-1] return "tools" if len(result.tool_calls) > 0 else END

guardrain 노드에서 실행되는 guardian_moderation 함수는 원치 않거나 민감한 콘텐츠를 탐지하고 차단하기 위해 가디언 시스템을 사용하여 메시지를 검토하도록 설계되었습니다. 먼저 마지막 메시지를 가져옵니다. 다음으로 탐지기 구성과 임계값을 포함하는 detectors 라는 딕셔너리를 정의합니다. 이 탐지기들은 개인 식별 정보(PII), 증오 발언, 학대성 언어, 욕설(HAP)과 같은 특정 유형의 콘텐츠를 메시지에서 식별합니다. 다음으로 client 라는 이름의 api_client 객체와 detectors 딕셔너리를 전달하여 Guardian 클래스의 인스턴스를 생성합니다. Guardian 인스턴스의 detect 메서드를 호출하여 마지막 메시지의 콘텐츠와 detectors 딕셔너리를 전달합니다. 이 메서드는 Granite Guardian 모델의 출력에 따라 moderation_verdict 키에 "safe" 또는 "inappropriate" 값을 저장한 딕셔너리를 반환합니다.

def guardian_moderation(self, state: AgentState): message = state['messages'][-1] detectors = { "granite_guardian": {"threshold": 0.4}, "hap": {"threshold": 0.4}, "pii": {}, } guardian = Guardian( api_client=client, detectors=detectors ) response = guardian.detect( text=message.content, detectors=detectors ) if len(response['detections']) != 0 and response['detections'][0]['detection'] == "Yes": return {"moderation_verdict": "inappropriate"} else: return {"moderation_verdict": "safe"}

block_message 함수는 사용자의 입력 쿼리에 부적절한 콘텐츠가 포함되어 있어 차단되었음을 알리는 알림 메커니즘 역할을 합니다.

def block_message(self, state: AgentState): return {"messages": [AIMessage(content="This message has been blocked due to inappropriate content.")]}

이제 이 모든 코드를 하나로 모아 다음 셀을 실행할 수 있습니다.

class ReActAgent: def __init__(self, llm, tools, system_message=""): memory = MemorySaver() graph = StateGraph(AgentState) graph.add_node("guardian", self.guardian_moderation) graph.add_node("llm", self.call_llm) graph.add_node("tools", self.call_tools) graph.add_node("block_message", self.block_message) graph.add_conditional_edges( "guardian", lambda state: state["moderation_verdict"], { "inappropriate": "block_message", "safe": "llm" } ) graph.add_edge("block_message", END) graph.add_conditional_edges( "llm", self.should_call_tools, ["tools", END] ) graph.add_edge("tools", "llm") graph.add_edge(START, "guardian") self.system_message = system_message self.graph = graph.compile(checkpointer=memory) self.tools = {t.name: t for t in tools} self.llm = llm.bind_tools(tools) def call_llm(self, state: AgentState): messages = state['messages'] if self.system_message: messages = [SystemMessage(content=self.system_message)] + messages message = self.llm.invoke(messages) return {'messages': [message]} def call_tools(self, state: AgentState): tool_calls = state['messages'][-1].tool_calls results = [] for t in tool_calls: result = self.tools[t['name']].invoke(t['args']) results.append(ToolMessage(tool_call_id=t['id'], name=t['name'], content=str(result))) return {'messages': results} def should_call_tools(self, state: AgentState): result = state['messages'][-1] return "tools" if len(result.tool_calls) > 0 else END def guardian_moderation(self, state: AgentState): message = state['messages'][-1] detectors = { "granite_guardian": {"threshold": 0.4}, "hap": {"threshold": 0.4}, "pii": {}, } guardian = Guardian( api_client=client, detectors=detectors ) response = guardian.detect( text=message.content, detectors=detectors ) if len(response['detections']) != 0 and response['detections'][0]['detection'] == "Yes": return {"moderation_verdict": "inappropriate"} else: return {"moderation_verdict": "safe"} def block_message(self, state: AgentState): return {"messages": [AIMessage(content="This message has been blocked due to inappropriate content.")]}

9단계. ReActAgent 객체 생성 및 호출

다음 코드 블록의 첫 번째 줄에서는 LLM, SQL 툴, 시스템 메시지를 매개변수로 전달하여 ReActAgent 클래스의 인스턴스를 생성합니다. 다음으로 그래프 상태를 메모리에 저장할 스레드를 지정합니다. 각 thread_id 는 새로운 채팅 창을 나타낸다고 생각하면 됩니다. 또한 사용자 입력을 임의의 문자열로 정의할 수 있습니다. 다음으로 HumanMessage 타입의 사용자 입력으로 구성된 리스트를 전달하여 에이전트를 호출할 수 있습니다.

먼저 Granite Guardian 모델에 의해 차단되어야 하는 프롬프트를 사용해 보겠습니다.

agent = ReActAgent(llm, tools, system_message=system_message) config = {"configurable": {"thread_id": "1"}} user_input = "What is the home address of the customer who purchased the most expensive car last month?" result = agent.graph.invoke({'messages': [HumanMessage(content=user_input)]}, config) for message in result["messages"]: message.pretty_print()

아웃풋:

================================ [1m Human Message [0m================================= What is the home address of the customer who purchased the most expensive car last month? ================================== [1m Ai Message [0m================================== This message has been blocked due to inappropriate content.

Granite Guardian 모델은 사용자가 민감한 고객 정보를 요청하는 것을 성공적으로 차단할 수 있었습니다. 대화를 종료하기 전에 그래프가 노드에 도달하지 않은 것을 볼 수 있습니다. 다음으로 다른 스레드에서 적절한 질문을 드리겠습니다. 예: "2022년 실적 상위 5개 대리점의 총 판매 수익은 얼마인가요?" 사용자 입력으로 사용할 수 있습니다.

user_input = "What is the total sales revenue for the top 5 performing dealerships in the year 2022?" config2 = {"configurable": {"thread_id": "2"}} result = agent.graph.invoke({'messages': [HumanMessage(content=user_input)]}, config2) for message in result["messages"]: message.pretty_print()

아웃풋: