Was ist agentenbasiertes Denken?

Autoren

Staff Writer

IBM Think

Staff Editor, AI Models

IBM Think

Was ist agentisches Denken?

Agentenbasierte Argumentation ist eine Komponente von KI-Agenten, die Entscheidungsfindung bestimmt. Sie ermöglicht es KI-Agenten, Aufgaben autonom auszuführen, indem sie bedingte Logik oder Heuristiken anwenden, sich auf Wahrnehmung und Gedächtnis stützen, Ziele verfolgen und für das bestmögliche Ergebnis optimieren können.

Frühere Modelle des maschinellen Lernens folgten einer Reihe vorprogrammierter Regeln, um zu einer Entscheidung zu gelangen. Die Fortschritte in der KI haben zu KI-Modellen mit weiterentwickelten Funktionen geführt, aber sie erfordern immer noch menschliches Eingreifen, um Informationen in Wissen umzuwandeln. Hier geht Agentisches Denken sogar noch einen Schritt weiter: KI-Agenten können aus Wissen Taten ableiten.

Die „Reasoning Engine“ steuert die Planungs- und Werkzeugaufrufphasen der Agenten-Workflows. Die Planung zerlegt eine Aufgabe in leichter zu handhabende Schlussfolgerungen, während der Aufruf von Werkzeugen die Entscheidung eines KI-Agenten durch verfügbare Werkzeuge unterstützt. Diese Werkzeuge können Programmierschnittstellen (APIs), externe Datensätze und Datenquellen wie Wissensgraphen umfassen.

Für Unternehmen kann die agentische KI das logische Denken durch Retrieval-Augmented Generation (RAG) weiter konkretisieren. RAG-Systeme können Unternehmensdaten und andere relevante Informationen abrufen, die zur Argumentation dem Kontext eines KI-Agenten hinzugefügt werden können.

Branchen-Newsletter

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Strategien des agentischen Denkens

Je nach Architektur und Typ eines Agenten kann das agentenbasierte Schlussfolgerungen auf unterschiedliche Weise angegangen werden. Hier sind einige gängige Techniken für das Denken von KI-Agenten, einschließlich der Vor- und Nachteile der einzelnen Techniken:

● Bedingte Logik

● Heuristiken

● ReAct (Vernunft (Reason) + Handlung (Act))

● ReWOO (Reasoning WithOut Observation)

● Selbstreflexion

● Multiagenten-Argumentation

Bedingte Logik

Einfache KI-Agenten folgen einer Reihe von vorprogrammierten Bedingungs-Aktionsregeln. Diese Regeln haben normalerweise die Form von „Wenn-Dann“ -Aussagen, wobei der „Wenn“ -Teil die Bedingung und der „Dann“ -Teil die Aktion angibt. Wenn eine Bedingung erfüllt ist, führt der Agent die entsprechende Aktion aus.

Diese Schlussfolgerungsmethode eignet sich besonders für domänenspezifische Anwendungsfälle. Im Finanzwesen beispielsweise kennzeichnet ein Agent zur Betrugserkennung eine Transaktion anhand eines von einer Bank festgelegten Kriteriensatzes als betrügerisch.

Dank der bedingten Logik kann die agentische KI nicht entsprechend handeln, wenn sie auf ein Szenario stößt, das sie nicht erkennt. Um diese Unflexibilität zu verringern, verwenden modellbasierte Agenten ihr Gedächtnis und ihre Wahrnehmung, um ein aktuelles Modell oder einen Zustand ihrer Umgebung zu speichern. Dieser Zustand wird laufend aktualisiert, sobald der Agent neue Informationen erhält. Modellbasierte Agenten sind jedoch nach wie vor an ihre Bedingungs-Aktions-Regeln gebunden.

Ein Roboter navigiert zum Beispiel durch ein Lagerhaus, um ein Produkt in ein Regal zu stellen. Für seine Route zieht er ein Modell des Lagers heran, aber wenn er ein Hindernis erkennt, kann er seinen Weg ändern, um das Hindernis zu umgehen und seine Fahrt fortzusetzen.

Heuristiken

KI-Agentensysteme können auch heuristische Verfahren zur Argumentation verwenden. Zielbasierte Agenten haben beispielsweise ein vordefiniertes Ziel. Mithilfe eines Suchalgorithmus finden sie Sequenzen von Aktionen, die ihnen helfen können, ihr Ziel zu erreichen, und planen diese Aktionen dann, bevor sie durchgeführt werden.

Ein autonomes Fahrzeug kann zum Beispiel über einen Navigationsagenten verfügen, dessen Ziel es ist, in Echtzeit den schnellsten Weg zu einem Ziel vorzuschlagen. Er kann verschiedene Routen durchsuchen und die schnellste empfehlen.

Wie zielorientierte Agenten suchen auch nutzungsorientierte Agenten nach Handlungssequenzen, die ein Ziel erreichen, berücksichtigen aber auch den Nutzen. Sie verwenden eine Nutzenfunktion, um das optimale Ergebnis zu ermitteln. Im Beispiel des Navigationsagenten kann die Aufgabe darin bestehen, nicht nur die schnellste Route zu finden, sondern auch eine, die am wenigsten Treibstoff verbraucht.

ReAct (Reason + Act)

Dieses Argumentationsparadigma beinhaltet eine Denk-Aktions-Beobachtungsschleife zur schrittweisen Problemlösung und iterativen Verbesserung der Antworten. Ein Agent wird angewiesen, Spuren seines Denkprozesses zu erzeugen,¹ ähnlich wie bei der Gedankenkette in generativer KI und großen Sprachmodellen (LLMs). Dann handelt er auf der Grundlage dieser Überlegungen und beobachtet seine Ausgabe,² um seinen Kontext mit neuen Überlegungen auf der Grundlage seiner Beobachtungen zu aktualisieren. Der Agent wiederholt den Zyklus, bis er zu einer Antwort oder Lösung gelangt.²

ReAct eignet sich gut für Aufgaben, die auf natürliche Sprache ausgelegt sind, und seine Rückverfolgbarkeit verbessert die Transparenz. Allerdings können sie auch wiederholt dieselben Argumente und Aktionen generieren, was zu Endlosschleifen führen kann.²

ReWOO (Reasoning WithOut Observation)

Im Gegensatz zu ReAct entfällt bei ReWOO der Beobachtungsschritt und plant stattdessen voraus. Dieses Entwurfsmuster für virtuelle Schlussfolgerungen besteht aus drei Modulen: Planer, Mitarbeiter und Solver.³

Das Planermodul unterteilt eine Aufgabe in Teilaufgaben und ordnet jede von ihnen einem Arbeitskraftmodul zu. Der Worker integriert Werkzeuge, mit denen jede Teilaufgabe mit Beweisen und Fakten untermauert wird. Schließlich synthetisiert das Solver-Modul alle Teilaufgaben und die entsprechenden Beweise, um eine Schlussfolgerung zu ziehen.³

ReWOO übertrifft ReAct bei bestimmten Benchmarks für die Verarbeitung natürlicher Sprache (NLP). Das Hinzufügen zusätzlicher Tools kann jedoch die Leistung von ReWOO beeinträchtigen, und es funktioniert nicht gut in Situationen, in denen es nur einen begrenzten Kontext zu seiner Umgebung hat.³

Selbstreflexion

Agentische KI kann auch Selbstreflexion als Teil der Bewertung und Verfeinerung ihrer Argumentationsfähigkeiten einbeziehen. Ein Beispiel hierfür ist Language Agent Tree Search (LATS), das Ähnlichkeiten mit dem Tree-of-Thinking-Prinzip in LLMs aufweist.

LATS wurde von der Monte Carlo Reinforcement Learning-Methode inspiriert, bei der Forscher die Monte Carlo Tree Search für LLM-basierte Agenten anpassten.⁴ LATS erstellt Decision Trees, die einen Zustand als Knoten und eine Edge als Aktion darstellt, sucht dann nach möglichen Aktionsoptionen und beauftragt einen Zustandsbewerter, um eine bestimmte Aktion auszuwählen.² Auch wird Selbstreflexion angewendet und eigene Beobachtungen sowie Feedback aus einem Sprachmodell miteinbezogen, um etwaige Denkfehler zu identifizieren und Alternativen zu empfehlen.² Die Argumentationsfehler und Überlegungen werden im Hauptspeicher abgelegt und dienen als zusätzlicher Kontext zum späteren Nachschlagen.⁴

LATS zeichnet sich durch komplexere Aufgaben wie Codierung und interaktive Fragebeantwortung sowie durch Workflow-Automatisierung, einschließlich Websuche und Navigation, aus.⁴ Ein komplexerer Ansatz und ein zusätzlicher Schritt zur Selbstreflexion machen LATS jedoch im Vergleich zu Methoden wie ReAct ressourcen- und zeitintensiver.²

Multi-Agent Argumentation

Multiagentensysteme bestehen aus mehreren KI-Agenten, die zusammenarbeiten, um komplexe Probleme zu lösen. Jeder Agent ist auf einen bestimmten Bereich spezialisiert und kann seine eigene Agenten-Argumentationsstrategie anwenden.

Die Entscheidungsfindung kann jedoch je nach Architektur des KI-Systems variieren. In einem hierarchischen oder vertikalen Ökosystem fungiert ein Agent als Anführer für die KI-Orchestrierung und entscheidet, welche Maßnahmen ergriffen werden. In einer horizontalen Architektur entscheiden die Agenten jedoch gemeinsam.

KI-Agenten

5 Arten von KI-Agenten: Autonome Funktionen und Anwendungen in der echten Welt

Erfahren Sie, wie sich zielgerichtete und dienstprogrammbasierte KI an Workflows und komplexe Umgebungen anpassen kann.

Erstellen, bereitstellen und überwachen Sie KI-Agenten

Herausforderungen im agentenischen Denken

Die Argumentation ist das Herzstück von KI-Agenten und kann zu leistungsfähigeren KI-Funktionen führen, aber es hat auch seine Grenzen. Hier sind einige Herausforderungen im Bereich des Agenten-Denkens:

● Rechnerische Komplexität

● Interpretierbarkeit

● Skalierbarkeit

Rechnerische Komplexität

Agentisches Denken von Agenten kann schwierig zu implementieren sein. Der Prozess erfordert auch viel Zeit und Rechenleistung, insbesondere bei der Lösung komplizierterer realer Probleme. Unternehmen müssen Wege finden, um die Denk-Strategien von Agenten zu optimieren und bereit zu sein, in die notwendigen KI-Plattformen und Ressourcen für die Entwicklung zu investieren.

Interpretierbarkeit

Der agentischen Argumentation könnte es an Erklärbarkeit und Transparenz darüber mangeln, wie Entscheidungen getroffen wurden. Verschiedene Methoden können dazu beitragen, die Interpretierbarkeit zu ermitteln. Die Integration von KI-Ethik und menschlicher Aufsicht in die Entwicklung von Algorithmen ist entscheidend, um sicherzustellen, dass KI-Lösungen faire, ethische und genaue Entscheidungen treffen.

Skalierbarkeit

Agentische Argumentationsmuster sind keine Einheitslösungen, weshalb es schwierig ist, sie für alle KI-Anwendungen zu skalieren. Unternehmen müssen diese Argumentationsmuster möglicherweise für jeden ihrer Anwendungsfälle anpassen, was Zeit und Aufwand erfordert.

Fußnoten

Alle Links befinden sich außerhalb von ibm.com

¹ ReAct: Synergizing Reasoning and Acting in Language Models, arXiv, 10. März 2023

² The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey, arXiv, 17. April 2024

³ Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models, arXiv, 6. Juni 2024

⁴ Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models, arXiv, 6. Juni 2024

ROI realisieren: Ein praktischer Leitfaden für agentische KI

Entdecken Sie Möglichkeiten, wie Sie KI erfolgreich in Ihrem Unternehmen skalieren und echte Ergebnisse erzielen können.

Ressourcen

Steigern Sie die Produktivität mit KI-Agenten, die für Ihr Unternehmen entwickelt wurden

Entdecken Sie das bahnbrechende Potenzial von KI-Agenten, die sich mühelos in Ihre Geschäftsabläufe integrieren lassen.

Einkaufsleitfaden für KI-Agenten 2025

In diesem umfassenden Leitfaden werden wichtige Anwendungsfälle, zentrale Funktionen und schrittweise Empfehlungen aufgeführt, die Ihnen bei der Auswahl der richtigen Lösungen für Ihr Unternehmen helfen.

Mit KI-Agenten und -Assistenten die Produktivität von Unternehmen neu definieren

Erfahren Sie, wie KI-Agenten und KI-Assistenten zusammenwirken können, um neue Produktivitätsniveaus zu erreichen.

Omdia-Bericht über handlungsfähige Intelligenz: Die Auswirkungen von KI-Agenten

Entdecken Sie, wie Sie sich das volle Potenzial von der generativen KI mit KI-Agenten erschließen können.

Das Zeitalter der agentischen Unternehmen: Einsatz von KI in Ihrem gesamten Technologiebestand

Bleiben Sie über die neuen KI-Agenten auf dem Laufenden, die einen grundlegenden Wendepunkt in der KI-Revolution darstellen.

watsonx Orchestrate testen

Erfahren Sie, wie generative KI-Assistenten Ihre Workloads erleichtern und die Produktivität steigern können.

Wie KI-Agenten die Produktivität neu definieren

Lernen Sie, wie Sie mithilfe von KI kreativer und effizienter werden und sich auf eine Zukunft einstellen können, in der Sie eng mit KI-Agenten zusammenarbeiten.

Die Zukunft der Agenten, der Energieverbrauch der KI, die Computernutzung von Anthropic und das Wasserzeichen von Google für KI-generierten Text

Bringen Sie sich in dieser Folge von Mixture of Experts mit unseren KI-Experten auf den neuesten Stand, wenn sie sich eingehend mit der Zukunft von KI-Agenten und mehr befassen.

Wie Comparus einen „Bankassistenten“ einsetzt

Comparus nutzte Lösungen von IBM watsonx.ai und präsentierte eindrucksvoll das Potenzial von dialogorientiertem Banking als neues Interaktionsmodell.

Weiterführende Lösungen

KI-Agenten für Unternehmen

Entwickeln, implementieren und verwalten Sie leistungsstarke KI-Assistenten und -Agenten, die Workflows und Prozesse mit generativer KI automatisieren.

Entdecken Sie watsonx Orchestrate

IBM KI-Agenten-Lösungen

Gestalten Sie die Zukunft Ihres Unternehmens mit KI-Lösungen, denen Sie vertrauen können.

KI-Agenten-Lösungen erkunden

IBM Consulting KI-Dienstleistungen

Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.

Erkunden Sie die Services im Bereich der künstlichen Intelligenz

Machen Sie den nächsten Schritt

Ganz gleich, ob Sie vorgefertigte Apps und Skills anpassen oder mithilfe eines KI-Studios eigene Agentenservices erstellen und bereitstellen möchten, die IBM watsonx-Plattform bietet Ihnen alles, was Sie brauchen.