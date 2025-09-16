Precisamos de algumas bibliotecas e módulos para este tutorial. Certifique-se de importar os seguintes e, se não estiverem instalados, uma instalação rápida de pip resolve o problema.

%pip install --quiet -U langgraph langchain-ibm langgraph_sdk langgraph-prebuilt google-search-results

Reinicie o kernel e importe os seguintes pacotes.

import getpass

import uuid



from ibm_watsonx_ai import APIClient, Credentials

from ibm_watsonx_ai.foundation_models.moderations import Guardian

from IPython.display import Image, display

from langchain_core.messages import AnyMessage, SystemMessage, HumanMessage, AIMessage

from langchain_ibm import ChatWatsonx

from langgraph.checkpoint.memory import MemorySaver

from langgraph.graph import START, END, StateGraph

from langgraph.graph.message import add_messages

from langgraph.prebuilt import tools_condition, ToolNode

from langgraph.types import interrupt, Command

from serpapi.google_search import GoogleSearch

from typing_extensions import TypedDict

from typing import Annotated

Para definir nossas credenciais, precisamos dos WATSONX_APIKEY e WATSONX_PROJECT_ID que você gerou na Etapa 1. Também definiremos os WATSONX_URL para servir como endpoint da API.

Para acessar a API do Google Patents, também precisamos de um SERPAPI_API_KEY . Você pode gerar uma chave gratuita fazendo registro na sua conta SerpApi ou registrando-se para uma.

WATSONX_APIKEY = getpass.getpass(“Please enter your watsonx.ai Runtime API key (hit enter): “)

WATSONX_PROJECT_ID = getpass.getpass(“Please enter your project ID (hit enter): “)

WATSONX_URL = getpass.getpass(“Please enter your watsonx.ai API endpoint (hit enter): “)

SERPAPI_API_KEY = getpass.getpass(“Please enter your SerpAPI API key (hit enter): “)

Antes de podermos inicializar nosso LLM, podemos usar a Credentials classe para encapsular nossas credenciais de API passadas.

credentials = Credentials(url=WATSONX_URL, api_key=WATSONX_APIKEY)

Etapa 4. Instancie o modelo de chat

Para poder interagir com todos os recursos disponíveis no watsonx.ai Runtime, você precisa configurar uma APIClient . Aqui, passamos nossas credenciais e WATSONX_PROJECT_ID .

client = APIClient(credentials=credentials, project_id=WATSONX_PROJECT_ID)

Para este tutorial, utilizaremos o wrapper ChatWatsonx para definir nosso modelo de chat. Esse wrapper simplifica a integração da chamada e do encadeamento de ferramentas. Nós incentivamos você a usar as referências de API nos ChatWatsonx documentos oficiais para mais informações. Podemos passar em nosso model_id para o LLM Granite e nosso cliente como parâmetros.

Observe que, se você usar um provedor de API diferente, precisará alterar o wrapper devidamente.

model_id = “ibm/granite-3-3-8b-instruct”

llm = ChatWatsonx(model_id=model_id, watsonx_client=client)

Etapa 5. Defina a ferramenta de raspagem de patentes

Os agentes de IA usam ferramentas para preencher lacunas de informações e devolver informações relevantes. Essas ferramentas podem incluir pesquisa na web, RAG, várias APIs, cálculos matemáticos e assim por diante. Com o uso da API Google Patents por meio da SerpAPI, podemos definir uma ferramenta para coleta de patentes. Essa ferramenta é uma função que toma o termo de pesquisa como argumento e retorna os resultados de pesquisa orgânica para patentes relacionadas. O GoogleSearch o wrapper exige parâmetros como o mecanismo de pesquisa, que no nosso caso são google_patents , o termo de pesquisa e, por fim, o SERPAPI_API_KEY .

def scrape_patents(search_term: str):

“””Search for patents about the topic.



Args:

search_term: topic to search for

“””

params = {

“engine”: “google_patents”,

“q”: search_term,

“api_key”: SERPAPI_API_KEY

}



search = GoogleSearch(params)

results = search.get_dict()

return results[‘organic_results’]

Em seguida, vamos vincular o LLM ao scrape_patents ferramenta usando o bind_tools método.

tools = [scrape_patents]

llm_with_tools = llm.bind_tools(tools)

Etapa 6. Primeira abordagem de HITL: interrupções estáticas

Os gráficos de agentes dp LangGraph são compostos de nós e edges. Os nós são funções que retransmitem, atualizam e retornam informações. Como rastreamos essas informações entre os nós? Bem, os gráficos de agentes exigem um estado, que contém todas as informações relevantes de que um agente precisa para tomar decisões. Os nós são conectados por edges, que são funções que selecionam o próximo nó a ser executado com base no estado atual. As edges podem ser condicionais ou fixas.

Vamos começar criando uma classe de AgentState para armazenar o contexto das mensagens do usuário, das ferramentas e do próprio agente. A classe TypedDict de Python é usada aqui para ajudar a garantir que as mensagens estejam no formato de dicionário apropriado. Também podemos usar o do LangGraph add_messages reducer do LangGraph para acrescentar qualquer nova mensagem à lista existente de mensagens.

class AgentState(TypedDict):

messages: Annotated[list[AnyMessage], add_messages]

Em seguida, defina a call_llm função que compõe o assistant nó. Esse nó simplesmente chamará o LLM com a mensagem atual do estado, bem como a mensagem do sistema.

sys_msg = SystemMessage(content=”You are a helpful assistant tasked with prior art search.”)



def call_llm(state: AgentState):

return {“messages”: [llm_with_tools.invoke([sys_msg] + state[“messages”])]

Em seguida, podemos definir o guardian_moderation função que compõe o guardian nó. Esse nó foi projetado para moderar mensagens usando um sistema de guardião, para detectar e bloquear conteúdo indesejado ou confidencial. Primeiro, a última mensagem é recuperada. Em seguida, um dicionário chamado detectors é definido como contendo as configurações do detector e seus valores-limite. Esses detectores identificam tipos específicos de conteúdo nas mensagens, como informação de identificação pessoal (PII), bem como discurso de ódio, linguagem abusiva e palavrões (HAP). Em seguida, uma instância da classe Guardian é criada, passando em um api_client objeto chamado client e o detectors dicionário. O detect método da instância do Guardian é chamado, passando o conteúdo da última mensagem e o detectors dicionário. O método, então, retorna um dicionário no qual a moderation_verdict a chave armazena um valor de "seguro" ou "inadequado", dependendo da saída do modelo Granite Guardian.

def guardian_moderation(state: AgentState):

message = state[‘messages’][-1]

detectors = {

“granite_guardian”: {“threshold”: 0.4},

“hap”: {“threshold”: 0.4},

“pii”: {},

}

guardian = Guardian(

api_client=client,

detectors=detectors

)

response = guardian.detect(

text=message.content,

detectors=detectors

)

if len(response[‘detections’]) != 0 and response[‘detections’][0][‘detection’] == “Yes”:

return {“moderation_verdict”: “inappropriate”}

else:

return {“moderation_verdict”: “safe”}

Agora, vamos definir o block_message função para servir como um mecanismo de notificação, informando ao usuário que a consulta de entrada tem conteúdo inadequado e foi bloqueada.

def block_message(state: AgentState):

return {“messages”: [AIMessage(content=”This message has been blocked due to inappropriate content.”)]

Agora, podemos reunir todas essas funções adicionando os nós correspondentes e conectando-os com edges que definem o fluxo do gráfico.

O gráfico começa no guardian nó, que chama o guardian_moderation método para detectar conteúdo prejudicial antes de chegar ao LLM e à API. A edge condicional entre os guardian e assistant nós encaminham o estado do gráfico para o assistant nó ou a extremidade. Essa posição é determinada pela saída da guardian_moderation função. Mensagens seguras são passadas para o assistant nó , que executa o call_llm método. Também adicionamos uma edge condicional entre os assistant e tools nós para rotear as mensagens adequadamente. Se o LLM retornar uma chamada da ferramenta, o tools_condition método roteia para o nó das ferramentas . Caso contrário, o gráfico será encaminhado para o fim. Essa etapa faz parte da arquitetura do agente do ReAct porque queremos que o agente receba a saída da ferramenta e reaja à mudança de estado para determinar sua próxima ação.

builder = StateGraph(AgentState)



builder.add_node(“guardian”, guardian_moderation)

builder.add_node(“block_message”, block_message)

builder.add_node(“assistant”, call_llm)

builder.add_node(“tools”, ToolNode(tools))



builder.add_edge(START, “guardian”)

builder.add_conditional_edges(

“guardian”,

lambda state: state[“moderation_verdict”],

{

“inappropriate”: “block_message”,

“safe”: “assistant”

}

)

builder.add_edge(“block_message”, END)

builder.add_conditional_edges(

“assistant”,

tools_condition,

)

builder.add_edge(“tools”, “assistant”)

memory = MemorySaver()

Em seguida, podemos compilar o gráfico, o que nos permite invocar o agente em uma etapa posterior. Para manter mensagens, podemos usar o MemorySaver checkpointer. Para implementar a primeira abordagem de supervisão humana, as interrupções estáticas, podemos definir o interrupt_before parâmetro para o assistant nó. Isso significa que, antes do gráfico encaminhar para o LLM no assistant nó, ocorrerá uma interrupção no gráfico para permitir que o ser humano que supervisiona o fluxo de trabalho agêntico possa fornecer feedback.

graph = builder.compile(interrupt_before=[“assistant”], checkpointer=memory)

Para obter uma representação visual do gráfico do agente, podemos exibir o fluxo do gráfico.

display(Image(graph.get_graph(xray=True).draw_mermaid_png()))

