Was ist agentenbasiertes Denken?

Autoren

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

Was ist agentisches Denken?

Agentenbasierte Argumentation ist eine Komponente von KI-Agenten, die Entscheidungsfindung bestimmt. Sie ermöglicht es KI-Agenten, Aufgaben autonom auszuführen, indem sie bedingte Logik oder Heuristiken anwenden, sich auf Wahrnehmung und Gedächtnis stützen, Ziele verfolgen und für das bestmögliche Ergebnis optimieren können.

Frühere Modelle des maschinellen Lernens folgten einer Reihe vorprogrammierter Regeln, um zu einer Entscheidung zu gelangen. Die Fortschritte in der KI haben zu KI-Modellen mit weiterentwickelten Funktionen geführt, aber sie erfordern immer noch menschliches Eingreifen, um Informationen in Wissen umzuwandeln. Hier geht Agentisches Denken sogar noch einen Schritt weiter: KI-Agenten können aus Wissen Taten ableiten.

Die „Reasoning Engine“ steuert die Planungs- und Werkzeugaufrufphasen der Agenten-Workflows. Die Planung zerlegt eine Aufgabe in leichter zu handhabende Schlussfolgerungen, während der Aufruf von Werkzeugen die Entscheidung eines KI-Agenten durch verfügbare Werkzeuge unterstützt. Diese Werkzeuge können Programmierschnittstellen (APIs), externe Datensätze und Datenquellen wie Wissensgraphen umfassen.

Für Unternehmen kann die agentische KI das logische Denken durch Retrieval-Augmented Generation (RAG) weiter konkretisieren. RAG-Systeme können Unternehmensdaten und andere relevante Informationen abrufen, die zur Argumentation dem Kontext eines KI-Agenten hinzugefügt werden können.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Strategien des agentischen Denkens

Je nach Architektur und Typ eines Agenten kann das agentenbasierte Schlussfolgerungen auf unterschiedliche Weise angegangen werden. Hier sind einige gängige Techniken für das Denken von KI-Agenten, einschließlich der Vor- und Nachteile der einzelnen Techniken:

    ● Bedingte Logik

    ● Heuristiken

    ● ReAct (Vernunft (Reason) + Handlung (Act))

    ● ReWOO (Reasoning WithOut Observation)

    ● Selbstreflexion

    ● Multiagenten-Argumentation

Bedingte Logik

Einfache KI-Agenten folgen einer Reihe von vorprogrammierten Bedingungs-Aktionsregeln. Diese Regeln haben normalerweise die Form von „Wenn-Dann“ -Aussagen, wobei der „Wenn“ -Teil die Bedingung und der „Dann“ -Teil die Aktion angibt. Wenn eine Bedingung erfüllt ist, führt der Agent die entsprechende Aktion aus.

Diese Schlussfolgerungsmethode eignet sich besonders für domänenspezifische Anwendungsfälle. Im Finanzwesen beispielsweise kennzeichnet ein Agent zur Betrugserkennung eine Transaktion anhand eines von einer Bank festgelegten Kriteriensatzes als betrügerisch.

Dank der bedingten Logik kann die agentische KI nicht entsprechend handeln, wenn sie auf ein Szenario stößt, das sie nicht erkennt. Um diese Unflexibilität zu verringern, verwenden modellbasierte Agenten ihr Gedächtnis und ihre Wahrnehmung, um ein aktuelles Modell oder einen Zustand ihrer Umgebung zu speichern. Dieser Zustand wird laufend aktualisiert, sobald der Agent neue Informationen erhält. Modellbasierte Agenten sind jedoch nach wie vor an ihre Bedingungs-Aktions-Regeln gebunden.

Ein Roboter navigiert zum Beispiel durch ein Lagerhaus, um ein Produkt in ein Regal zu stellen. Für seine Route zieht er ein Modell des Lagers heran, aber wenn er ein Hindernis erkennt, kann er seinen Weg ändern, um das Hindernis zu umgehen und seine Fahrt fortzusetzen.

Heuristiken

KI-Agentensysteme können auch heuristische Verfahren zur Argumentation verwenden. Zielbasierte Agenten haben beispielsweise ein vordefiniertes Ziel. Mithilfe eines Suchalgorithmus finden sie Sequenzen von Aktionen, die ihnen helfen können, ihr Ziel zu erreichen, und planen diese Aktionen dann, bevor sie durchgeführt werden.

Ein autonomes Fahrzeug kann zum Beispiel über einen Navigationsagenten verfügen, dessen Ziel es ist, in Echtzeit den schnellsten Weg zu einem Ziel vorzuschlagen. Er kann verschiedene Routen durchsuchen und die schnellste empfehlen.

Wie zielorientierte Agenten suchen auch nutzungsorientierte Agenten nach Handlungssequenzen, die ein Ziel erreichen, berücksichtigen aber auch den Nutzen. Sie verwenden eine Nutzenfunktion, um das optimale Ergebnis zu ermitteln. Im Beispiel des Navigationsagenten kann die Aufgabe darin bestehen, nicht nur die schnellste Route zu finden, sondern auch eine, die am wenigsten Treibstoff verbraucht.

ReAct (Reason + Act)

Dieses Argumentationsparadigma beinhaltet eine Denk-Aktions-Beobachtungsschleife zur schrittweisen Problemlösung und iterativen Verbesserung der Antworten. Ein Agent wird angewiesen, Spuren seines Denkprozesses zu erzeugen,1 ähnlich wie bei der Gedankenkette in generativer KI und großen Sprachmodellen (LLMs). Dann handelt er auf der Grundlage dieser Überlegungen und beobachtet seine Ausgabe,2 um seinen Kontext mit neuen Überlegungen auf der Grundlage seiner Beobachtungen zu aktualisieren. Der Agent wiederholt den Zyklus, bis er zu einer Antwort oder Lösung gelangt.2

ReAct eignet sich gut für Aufgaben, die auf natürliche Sprache ausgelegt sind, und seine Rückverfolgbarkeit verbessert die Transparenz. Allerdings können sie auch wiederholt dieselben Argumente und Aktionen generieren, was zu Endlosschleifen führen kann.2

ReWOO (Reasoning WithOut Observation)

Im Gegensatz zu ReAct entfällt bei ReWOO der Beobachtungsschritt und plant stattdessen voraus. Dieses Entwurfsmuster für virtuelle Schlussfolgerungen besteht aus drei Modulen: Planer, Mitarbeiter und Solver.3

Das Planermodul unterteilt eine Aufgabe in Teilaufgaben und ordnet jede von ihnen einem Arbeitskraftmodul zu. Der Worker integriert Werkzeuge, mit denen jede Teilaufgabe mit Beweisen und Fakten untermauert wird. Schließlich synthetisiert das Solver-Modul alle Teilaufgaben und die entsprechenden Beweise, um eine Schlussfolgerung zu ziehen.3

ReWOO übertrifft ReAct bei bestimmten Benchmarks für die Verarbeitung natürlicher Sprache (NLP). Das Hinzufügen zusätzlicher Tools kann jedoch die Leistung von ReWOO beeinträchtigen, und es funktioniert nicht gut in Situationen, in denen es nur einen begrenzten Kontext zu seiner Umgebung hat.3

Selbstreflexion

Agentische KI kann auch Selbstreflexion als Teil der Bewertung und Verfeinerung ihrer Argumentationsfähigkeiten einbeziehen. Ein Beispiel hierfür ist Language Agent Tree Search (LATS), das Ähnlichkeiten mit dem Tree-of-Thinking-Prinzip in LLMs aufweist.

LATS wurde von der Monte Carlo Reinforcement Learning-Methode inspiriert, bei der Forscher die Monte Carlo Tree Search für LLM-basierte Agenten anpassten.4 LATS erstellt Decision Trees, die einen Zustand als Knoten und eine Edge als Aktion darstellt, sucht dann nach möglichen Aktionsoptionen und beauftragt einen Zustandsbewerter, um eine bestimmte Aktion auszuwählen.2 Auch wird Selbstreflexion angewendet und eigene Beobachtungen sowie Feedback aus einem Sprachmodell miteinbezogen, um etwaige Denkfehler zu identifizieren und Alternativen zu empfehlen.2 Die Argumentationsfehler und Überlegungen werden im Hauptspeicher abgelegt und dienen als zusätzlicher Kontext zum späteren Nachschlagen.4

LATS zeichnet sich durch komplexere Aufgaben wie Codierung und interaktive Fragebeantwortung sowie durch Workflow-Automatisierung, einschließlich Websuche und Navigation, aus.4 Ein komplexerer Ansatz und ein zusätzlicher Schritt zur Selbstreflexion machen LATS jedoch im Vergleich zu Methoden wie ReAct ressourcen- und zeitintensiver.2

Multi-Agent Argumentation

Multiagentensysteme bestehen aus mehreren KI-Agenten, die zusammenarbeiten, um komplexe Probleme zu lösen. Jeder Agent ist auf einen bestimmten Bereich spezialisiert und kann seine eigene Agenten-Argumentationsstrategie anwenden.

Die Entscheidungsfindung kann jedoch je nach Architektur des KI-Systems variieren. In einem hierarchischen oder vertikalen Ökosystem fungiert ein Agent als Anführer für die KI-Orchestrierung und entscheidet, welche Maßnahmen ergriffen werden. In einer horizontalen Architektur entscheiden die Agenten jedoch gemeinsam.

KI-Agenten

5 Arten von KI-Agenten: Autonome Funktionen und Anwendungen in der echten Welt

Erfahren Sie, wie sich zielgerichtete und dienstprogrammbasierte KI an Workflows und komplexe Umgebungen anpassen kann.

Herausforderungen im agentenischen Denken

Die Argumentation ist das Herzstück von KI-Agenten und kann zu leistungsfähigeren KI-Funktionen führen, aber es hat auch seine Grenzen. Hier sind einige Herausforderungen im Bereich des Agenten-Denkens:

    ● Rechnerische Komplexität

    ● Interpretierbarkeit

    ● Skalierbarkeit

Rechnerische Komplexität

Agentisches Denken von Agenten kann schwierig zu implementieren sein. Der Prozess erfordert auch viel Zeit und Rechenleistung, insbesondere bei der Lösung komplizierterer realer Probleme. Unternehmen müssen Wege finden, um die Denk-Strategien von Agenten zu optimieren und bereit zu sein, in die notwendigen KI-Plattformen und Ressourcen für die Entwicklung zu investieren.

Interpretierbarkeit

Der agentischen Argumentation könnte es an Erklärbarkeit und Transparenz darüber mangeln, wie Entscheidungen getroffen wurden. Verschiedene Methoden können dazu beitragen, die Interpretierbarkeit zu ermitteln. Die Integration von KI-Ethik und menschlicher Aufsicht in die Entwicklung von Algorithmen ist entscheidend, um sicherzustellen, dass KI-Lösungen faire, ethische und genaue Entscheidungen treffen.

Skalierbarkeit

Agentische Argumentationsmuster sind keine Einheitslösungen, weshalb es schwierig ist, sie für alle KI-Anwendungen zu skalieren. Unternehmen müssen diese Argumentationsmuster möglicherweise für jeden ihrer Anwendungsfälle anpassen, was Zeit und Aufwand erfordert.

Weiterführende Lösungen
KI-Agenten für Unternehmen

Entwickeln, implementieren und verwalten Sie leistungsstarke KI-Assistenten und -Agenten, die Workflows und Prozesse mit generativer KI automatisieren.

    Entdecken Sie watsonx Orchestrate
    IBM KI-Agenten-Lösungen

    Gestalten Sie die Zukunft Ihres Unternehmens mit KI-Lösungen, denen Sie vertrauen können.

    KI-Agenten-Lösungen erkunden
    IBM Consulting KI-Dienstleistungen

    Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.

    Erkunden Sie die Services im Bereich der künstlichen Intelligenz
    Machen Sie den nächsten Schritt

    Ganz gleich, ob Sie vorgefertigte Apps und Skills anpassen oder mithilfe eines KI-Studios eigene Agentenservices erstellen und bereitstellen möchten, die IBM watsonx-Plattform bietet Ihnen alles, was Sie brauchen.

    Entdecken Sie watsonx Orchestrate watsonx.ai erkunden