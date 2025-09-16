Für dieses Tutorial benötigen wir einige Bibliotheken und Module. Stellen Sie sicher, dass Sie die folgenden Pakete importieren. Falls diese nicht installiert sind, kann eine schnelle Pip-Installation das Problem beheben.

%pip install --quiet -U langgraph langchain-ibm langgraph_sdk langgraph-prebuilt google-search-results

Starten Sie den Kernel neu und importieren Sie die folgenden Pakete.

import getpass

import uuid



from ibm_watsonx_ai import APIClient, Credentials

from ibm_watsonx_ai.foundation_models.moderations import Guardian

from IPython.display import Image, display

from langchain_core.messages import AnyMessage, SystemMessage, HumanMessage, AIMessage

from langchain_ibm import ChatWatsonx

from langgraph.checkpoint.memory import MemorySaver

from langgraph.graph import START, END, StateGraph

from langgraph.graph.message import add_messages

from langgraph.prebuilt import tools_condition, ToolNode

from langgraph.types import interrupt, Command

from serpapi.google_search import GoogleSearch

from typing_extensions import TypedDict

from typing import Annotated

Um unsere Zugangsdaten festzulegen, benötigen wir die WATSONX_APIKEY und WATSONX_PROJECT_ID die Sie in Schritt 1 generiert haben. Wir werden auch WATSONX_URL festlegen, um es als API-Endpunkt zu nutzen.

Für den Zugriff auf die Google Patents API benötigen wir außerdem eine SERPAPI_API_KEY Sie können einen kostenlosen Schlüssel generieren, indem Sie sich in Ihr SerpApi-Konto einloggen oder sich dafür registrieren.

WATSONX_APIKEY = getpass.getpass(“Please enter your watsonx.ai Runtime API key (hit enter): “)

WATSONX_PROJECT_ID = getpass.getpass(“Please enter your project ID (hit enter): “)

WATSONX_URL = getpass.getpass(“Please enter your watsonx.ai API endpoint (hit enter): “)

SERPAPI_API_KEY = getpass.getpass(“Please enter your SerpAPI API key (hit enter): “)

Bevor wir unser LLM initialisieren können, können wir die Credentials -Klasse verwenden, um unsere übergebenen API-Anmeldeinformationen zu kapseln.

credentials = Credentials(url=WATSONX_URL, api_key=WATSONX_APIKEY)

Schritt 4. Instanziieren Sie das Chat-Modell

Um mit allen in watsonx.ai-Laufzeit verfügbaren Ressourcen interagieren zu können, müssen Sie eine einrichten APIClient . Hier geben wir unsere Anmeldedaten ein und WATSONX_PROJECT_ID .

client = APIClient(credentials=credentials, project_id=WATSONX_PROJECT_ID)

In diesem Tutorial verwenden wir den ChatWatsonx-Wrapper, um unser Chat-Modell einzurichten. Dieser Wrapper vereinfacht die Integration des Toolaufrufs und der Verkettung. Wir empfehlen Ihnen, die API-Referenzen in den ChatWatsonx offiziellen Dokumente für weitere Informationen vorlegen. Wir können unsere model_id für Granite LLM und unseren Client als Parameter übergeben.

Beachten Sie, dass Sie den Wrapper entsprechend ändern müssen, wenn Sie einen anderen API-Anbieter verwenden.

model_id = “ibm/granite-3-3-8b-instruct”

llm = ChatWatsonx(model_id=model_id, watsonx_client=client)

Schritt 5. Definieren Sie das Patent-Scraper-Tool

KI-Agenten verwenden Tools, um Informationslücken zu schließen und relevante Informationen zurückzugeben. Diese Tools können Websuche, RAG, verschiedene APIs, mathematische Berechnungen usw. umfassen. Mit der Google Patents API über SerpAPI definieren wir ein Tool zum Scraping von Patenten. Bei diesem Tool handelt es sich um eine Funktion, die den Suchbegriff als Argument verwendet und die organischen Suchergebnisse für verwandte Patente ausgibt. Dann GoogleSearch Wrapper benötigt Parameter wie die Suchmaschine, was in unserem Fall der Fall google_patents den Suchbegriff übergeben und anschließend SERPAPI_API_KEY .

def scrape_patents(search_term: str):

“””Search for patents about the topic.



Args:

search_term: topic to search for

“””

params = {

“engine”: “google_patents”,

“q”: search_term,

“api_key”: SERPAPI_API_KEY

}



search = GoogleSearch(params)

results = search.get_dict()

return results[‘organic_results’]

Als nächstes binden wir das LLM an den scrape_patents das Tool binden. bind_tools Verfahren ist.

tools = [scrape_patents]

llm_with_tools = llm.bind_tools(tools)

Schritt 6. Erster HITL-Ansatz: Statische Unterbrechungen

LangGraph-Agentendiagramme bestehen aus Knoten und Edges. Knoten sind Funktionen, die Informationen weiterleiten, aktualisieren und zurückgeben. Wie verfolgen wir diese Informationen zwischen den Knoten? Nun, Agentendiagramme benötigen einen Zustand, der alle relevanten Informationen enthält, die ein Agent benötigt, um Entscheidungen zu treffen. Knoten sind durch Edges verbunden, die Funktionen sind, die basierend auf dem aktuellen Status den nächsten Knoten auswählen, der ausgeführt werden soll. Edges können entweder bedingt oder fest sein.

Beginnen wir mit der Erstellung eines AgentState Klasse, um den Kontext der Nachrichten des Benutzers, der Tools und des Agenten selbst zu speichern. Pythons TypedDict Klasse wird hier verwendet, um sicherzustellen, dass Nachrichten im entsprechenden Wörterbuchformat vorliegen. Wir können auch LangGraph verwenden add_messages Reduzierfunktion zum Anhängen neuer Nachrichten an die vorhandene Nachrichtenliste.

class AgentState(TypedDict):

messages: Annotated[list[AnyMessage], add_messages]

Danach wird die Methode call_llm Funktion, aus der sich die Funktion assistant Knoten. Dieser Knoten ruft einfach das LLM mit der aktuellen Meldung über den Status sowie der Systemnachricht auf.

sys_msg = SystemMessage(content=”You are a helpful assistant tasked with prior art search.”)



def call_llm(state: AgentState):

return {“messages”: [llm_with_tools.invoke([sys_msg] + state[“messages”])]

Als Nächstes können wir den guardian_moderation Funktion, aus der sich die Funktion guardian Knoten definieren. Dieser Knoten ist darauf ausgelegt, Nachrichten mithilfe eines Überwachungssystems zu moderieren, um unerwünschte oder vertrauliche Inhalte zu erkennen und zu blockieren. Zuerst wird die letzte Nachricht abgerufen. Als Nächstes wird ein Wörterbuch mit dem Namen detectors definiert, das die Melderkonfigurationen und ihre Schwellenwerte enthält. Diese Melder identifizieren bestimmte Arten von Inhalten in Nachrichten, wie z. B. personenbezogene Daten (Personally Identifiable Information, PII) sowie Hassrede, beleidigende Sprache und Profanität (HAP). Als Nächstes wird eine Instanz der Guardian-Klasse erstellt und an ein api_client object named client und die detectors Wörterverzeichnis. Das detect der Guardian-Instanz aufgerufen, wobei der Inhalt der letzten Nachricht und detectors Wörterverzeichnis. Die Methode gibt dann ein Wörterverzeichnis zurück, in dem die moderation_verdict Der Schlüssel speichert je nach Ausgabe des Granite Guardian-Modells entweder den Wert „sicher“ oder „unangemessen“.

def guardian_moderation(state: AgentState):

message = state[‘messages’][-1]

detectors = {

“granite_guardian”: {“threshold”: 0.4},

“hap”: {“threshold”: 0.4},

“pii”: {},

}

guardian = Guardian(

api_client=client,

detectors=detectors

)

response = guardian.detect(

text=message.content,

detectors=detectors

)

if len(response[‘detections’]) != 0 and response[‘detections’][0][‘detection’] == “Yes”:

return {“moderation_verdict”: “inappropriate”}

else:

return {“moderation_verdict”: “safe”}

Nun definieren wir die block_message Funktion, die als Benachrichtigungsmechanismus dient und den Benutzer darüber informiert, dass seine Eingabeabfrage unangemessene Inhalte enthält und blockiert wurde.

def block_message(state: AgentState):

return {“messages”: [AIMessage(content=”This message has been blocked due to inappropriate content.”)]

Wir können nun all diese Funktionen zusammenfügen, indem wir die entsprechenden Knoten hinzufügen und sie mit Edges verbinden, die den Fluss des Graphen definieren.

Der Graph beginnt guardian Knoten, der die guardian_moderation Methode auslöst, um schädliche Inhalte zu erkennen, bevor sie das LLM und die API erreichen. Die bedingte Edge zwischen den guardian und assistant Knoten leiten den Zustand des Diagramms entweder an den assistant Knoten oder das Ende weiter. Diese Position wird durch die Ausgabe der guardian_moderation Funktion bestimmt. Sichere Nachrichten werden an das assistant am Startknoten call_llm Verfahren. Wir fügen auch eine bedingte Edge zwischen den assistant und tools Knoten hinzu, um Nachrichten entsprechend weiterzuleiten. Wenn das LLM einen Toolaufruf zurückgibt, leitet die tools_condition Methode zum Tools-Knoten weiter. Andernfalls führt das Diagramm das Routing bis zum Ende durch. Dieser Schritt ist Teil der Architektur des ReAct-Agenten. Wir wollen, dass der Agent die Ausgabe des Tools empfängt und dann auf die Zustandsänderung reagiert, um seine nächste Aktion zu bestimmen.

builder = StateGraph(AgentState)



builder.add_node(“guardian”, guardian_moderation)

builder.add_node(“block_message”, block_message)

builder.add_node(“assistant”, call_llm)

builder.add_node(“tools”, ToolNode(tools))



builder.add_edge(START, “guardian”)

builder.add_conditional_edges(

“guardian”,

lambda state: state[“moderation_verdict”],

{

“inappropriate”: “block_message”,

“safe”: “assistant”

}

)

builder.add_edge(“block_message”, END)

builder.add_conditional_edges(

“assistant”,

tools_condition,

)

builder.add_edge(“tools”, “assistant”)

memory = MemorySaver()

Als Nächstes können wir das Diagramm kompilieren, sodass wir den Agenten in einem späteren Schritt aufrufen können. Um Nachrichten zu speichern, können wir die MemorySaver Checkpointer verwenden. Um den ersten Ansatz der menschlichen Beaufsichtigung zu implementieren, statische Unterbrechungen, können wir den interrupt_before Parameter auf den assistant Knoten einstellen. Dies bedeutet, dass vor dem Routing des Graphen an das LLM in dem assistant Knoten eine Grafikunterbrechung stattfindet, damit der Mensch, der den Agenten-Workflow überwacht, Feedback geben kann.

graph = builder.compile(interrupt_before=[“assistant”], checkpointer=memory)

Um eine visuelle Darstellung des Agentengraphen zu erhalten, können wir den Graphfluss anzeigen.

display(Image(graph.get_graph(xray=True).draw_mermaid_png()))

Output: