Was ist Agentenarchitektur?

Autoren

Vanna Winland

AI Advocate & Technology Writer

Jess Bozorg

Lead, AI Advocacy

IBM

Cole Stryker

Staff Editor, AI Models

IBM Think

Was ist Agentenarchitektur?

Agentische Architektur bezieht sich auf die Struktur und das Design agentischer Frameworks für künstliche Intelligenz (KI). Eine agentische Architektur ist eine Architektur, die den virtuellen Raum und die Workflow-Struktur so gestaltet, dass KI-Modelle innerhalb eines agentischen KI-Systems automatisiert werden können.

Agentische KI ist ein System oder Programm, das KI-Agenten verwendet, um Aufgaben für einen Benutzer oder ein anderes System autonom auszuführen. Die Agentenarchitektur unterstützt und reguliert das Verhalten von KI-gestützten Agenten, die innerhalb eines generativen KI-Systems (gen AI) arbeiten. Agentische KI-Systeme erfordern, dass ihre Agenten anpassungsfähig sind und sich in dynamischen Umgebungen zurechtfinden, um die gewünschten Ergebnisse zu erzielen.

Das Modell unterscheidet sich nicht so sehr von der menschlichen Psychologie – Handlungsfähigkeit bezieht sich auf die Fähigkeit, etwas auf der Grundlage der eigenen Handlungen absichtlich geschehen zu lassen.1 Um die gewünschten Ergebnisse zu erzielen, muss man Planung, Handeln, Gedächtnis und Reflexion einsetzen. Diese Eigenschaften stimmen mit denen moderner KI-Agenten überein, die sowohl in Einzel- als auch in Multi-Agent-Frameworks verwendet werden.
 
Fortschritte bei Algorithmen des maschinellen Lernens (ML) und großen Sprachmodellen (LLMs) wie GPT von OpenAI haben die Entwicklung von KI-Agenten vorangetrieben. Ziel der agentischen Architektur ist es, eine Struktur für ein LLM bereitzustellen, um Agenten bei der Erledigung komplexer Aufgaben zu automatisieren.

Das autonome oder Entscheidungsfindungs-Verhalten eines KI-Agenten hängt von der Infrastruktur ab, die es ermöglicht. Die Agentenarchitektur ist so konzipiert, dass sie sich an dynamische Umgebungen anpasst und die Interoperabilität verbessert.

Agenten können beispielsweise mit verschiedenen Datenquellen und Formaten, Anwendungsprogrammierschnittstellen (APIs) oder Systemen verbunden werden. Dank dieses anpassungsfähigen Verhaltens können Agenten fundierte Entscheidungen treffen.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Funktionsweise der agentischen Architektur

Die Architektur einer agentischen KI sollte aus Komponenten bestehen, die die Kernfaktoren einer Agentur ansprechen: Intentionalität (Planung), Voraussicht, Selbstreaktivität und Selbstreflexion.2 Diese Faktoren bieten KI-Agenten Autonomie, sodass sie Ziele setzen, planen und ihre Leistung überwachen sowie überlegen können, wie sie ihr spezifisches Ziel erreichen können.
 
Die Agentic-Technologie nutzt Backend-Tools, um aktuelle Informationen zu sammeln, optimiert komplexe Workflows und generiert automatisch Aufgaben zur Erreichung komplexer Ziele.

Während es arbeitet, passt sich der autonome Agent im Laufe der Zeit an die Vorlieben des Benutzers an, bietet eine personalisiertere Erfahrung und detailliertere Antworten. Dieser Tool-Aufrufprozess kann ohne menschliches Zutun ablaufen, wodurch sich die Möglichkeiten für reale KI-Anwendungen erweitern.

KI-Agenten

5 Arten von KI-Agenten: Autonome Funktionen und Anwendungen in der echten Welt

Erfahren Sie, wie sich zielgerichtete und dienstprogrammbasierte KI an Workflows und komplexe Umgebungen anpassen kann.

Agentisch vs. nicht-agentisch

Agentische Architekturen unterstützen das agentenbasierte Verhalten innerhalb von KI-Agenten. KI-Agenten sind anpassungsfähige Systeme, die auf maschinellen Lernmodellen basieren, mit externen Umgebungen interagieren und Tools verwenden, um bestimmte Ziele zu erreichen. Nicht alle KI-Agenten sind agentisch. Es hängt von der Komplexität und den Fähigkeiten des Orchestrierungs-Frameworks oder -Systems ab.

Die agentische Architektur ermöglicht es KI-Agenten, mit einem gewissen Maß an Autonomie zu handeln und Entscheidungen auf der Grundlage von Zielen zu treffen, ohne dass ständig menschlicher Input erforderlich ist.3 Autonome KI-Agenten benötigen wenig bis gar kein menschliches Eingreifen, um ihre spezifischen Aufgaben zu erledigen.

In nicht-agentischen Architekturen sind LLMs in der Lage, singuläre oder lineare Aufgaben auszuführen.4 Die Funktion des KI-Modells in einer nicht-agentischen Architektur besteht darin, basierend auf Eingaben und Kontext Outputs bereitzustellen.

Ohne explizite Orchestrierung können LLMs keine neuen Informationen in Echtzeit speichern und haben aufgrund ihres begrenzten Kontexts oft mit komplexen Problemen zu kämpfen. Zu den gängigen KI-Anwendungen, die keine komplexen Agenten-Workflows erfordern, gehören beispielsweise semantische Analysen, Chatbots und Textgenerierung.

Die ideale Agentenarchitektur hängt von den Anforderungen der Anwendung und des Anwendungsfalls ab. Single-Agent-Systeme zeichnen sich durch die Lösung zielgerichteter, spezifischer Probleme aus und fungieren im Wesentlichen als individuelle Problemlöser.

Einige Herausforderungen erfordern jedoch möglicherweise das einzigartige Fachwissen eines spezialisierten Agenten, während andere von einem kollaborativen Ansatz profitieren könnten, bei dem mehrere Agenten als Team zusammenarbeiten.

Arten von agentischen Architekturen

Die Tabelle bietet einen übersichtlichen Vergleich verschiedener Systemtypen für KI-Agenten-Architekturen: vertikal, horizontal und hybrid. Es werden deren Strukturen, Hauptmerkmale, Stärken, Schwächen und beste Anwendungsfälle hervorgehoben, um den am besten geeigneten Ansatz für verschiedene Aufgaben zu ermitteln. 

Single-Agent-Architekturen

Eine Single-Agent-Architektur weist eine einzelne autonome Einheit auf, die in einer Umgebung zentralisierte Entscheidungen trifft.

  • Struktur

    • Eine Single-Agent-Architektur ist ein System, in dem ein einzelner KI-Agent unabhängig agiert, um seine Umgebung wahrzunehmen, Entscheidungen zu treffen und Maßnahmen zu ergreifen, um ein Ziel zu erreichen.

  • Hauptmerkmale

    • Autonomie: Der Agent agiert unabhängig, ohne dass eine Interaktion mit anderen Agenten erforderlich ist.
       
  • Stärken

    • Einfachheit: Einfacheres Entwerfen, Entwickeln und Bereitstellen im Vergleich zu Multi-Agent-Systemen. Benötigt weniger Ressourcen, da nicht mehrere Agenten oder Kommunikationsprotokolle verwaltet werden müssen.
    • Vorhersagbarkeit: Einfacher zu debuggen und zu überwachen, da der Agent unabhängig arbeitet.
    • Geschwindigkeit: Es sind keine Verhandlungen oder Konsensfindungen zwischen mehreren Akteuren erforderlich.
    • Kosten: Geringere Wartung und Aktualisierungen im Vergleich zu komplexen Multi-Agent-Architekturen. Weniger Integrationsherausforderungen beim Bereitstellen in Unternehmensanwendungen.
       
  • Schwächen

    • Begrenzte Skalierbarkeit: Ein einzelner Agent kann bei der Erledigung umfangreicher oder komplexer Aufgaben zu einem Engpass werden.
    • Starrheit: Probleme mit Aufgaben, die mehrstufige Workflows oder eine bereichsübergreifende Koordination erfordern.
    • Schmal: In der Regel für eine bestimmte Funktion oder Domäne konzipiert.
       
  • Die besten Anwendungsfälle

    • Einfache Chatbots: Chatbots können unabhängig agieren, erfordern keine Koordination mit anderen Bearbeitern und funktionieren gut in eigenständigen, strukturierten Benutzerinteraktionen.
    • Empfehlungssysteme: Personalisierte Inhaltsempfehlungen, wie sie beispielsweise bei Streaming-Diensten zu finden sind, sind für eine Architektur mit einem einzigen Agenten relativ einfach zu realisieren.

Multi-Agent-Architekturen

Multi-Agent-Architekturen gehen über die KI-Funktionen herkömmlicher Single-Agent-Setups hinaus und bringen mehrere einzigartige Vorteile mit. Jeder Agent ist auf einen bestimmten Bereich spezialisiert, z. B. auf Leistungsanalyse, Verletzungsprävention oder Marktforschung, und arbeitet nahtlos an der Lösung komplexer Probleme zusammen.

Agenten passen ihre Rollen an sich ändernde Aufgaben an und tragen so dazu bei, Flexibilität und Reaktionsfähigkeit in dynamischen Szenarien zu gewährleisten.

Multi-Agent-Systeme sind flexibler. Ein Agent könnte die Verarbeitung natürlicher Sprache (NLP) verwenden, ein anderer könnte sich auf Computer Vision spezialisiert haben. Ein Agent könnte RAG (Retrieval Augmented Generation) verwenden, um Daten aus externen Datensätzen abzurufen.

Es gibt viele Anbieter von Multi-Agent-Frameworks wie CrewAI, ein Python-basiertes Multi-Agent-Framework, das auf LangChain aufbaut. Eine weitere KI-Lösung ist DeepWisdom, das MetaGPT anbietet, ein Framework, das einen strukturierten Arbeitsablauf verwendet, der von Standardbetriebsverfahren geleitet wird.

Vertikale KI-Architekturen

  • Struktur

    • In einer vertikalen Architektur überwacht ein leitender Agent Teilaufgaben und Entscheidungen, während Agenten Bericht erstatten, um eine zentrale Kontrolle sicherzustellen.5 Hierarchische KI-Agenten kennen ihre Rolle und berichten anderen Agenten entsprechend oder beaufsichtigen sie.
       
  • Hauptmerkmale

    • Hierarchie: Rollen sind klar definiert.
    • Zentralisierte Kommunikation: Bearbeiter berichten an die Führungskraft.
       
  • Stärken

    • Aufgabeneffizienz: Ideal für sequenzielle Workflows.
    • Klare Verantwortlichkeit: Die Führungskraft stimmt das Ziel ab.
  • Schwächen

    • Engpässe: Das Vertrauen in Führungskräfte kann den Fortschritt verlangsamen.

    • Single Point of Failure: Anfällig für Leader-Probleme.

  • Beste Anwendungsfall

    • Workflow-Automatisierung: Mehrstufige Genehmigungen.

    • Document Generation: Abschnitte, die von einem Leiter überwacht werden.

Horizontale KI-Architekturen

  • Struktur

    • Gleichgestelltes Zusammenarbeitarbeitsmodell: Agenten arbeiten gleichberechtigt in einem dezentralen System und arbeiten frei zusammen, um Aufgaben zu lösen.6

  • Hauptmerkmale

    • Verteilte Zusammenarbeit: Alle Bearbeiter teilen Ressourcen und Ideen gemeinsam.

    • Dezentrale Entscheidungen: Gruppengesteuerte Entscheidungsfindung für kollaborative Autonomie.

  • Stärken

    • Dynamische Problemlösung: Fördert Innovation.

    • Parallelverarbeitung: Agenten bearbeiten Aufgaben gleichzeitig.

  • Schwächen

    • Herausforderungen bei der Koordination : Missmanagement kann zu Ineffizienzen führen.

    • Langsamere Entscheidungen: Zu viel Überlegung.

  • Beste Anwendungsfall

    • Brainstorming: Generieren vielfältiger Ideen.

    • Lösung komplexer Probleme: Bewältigung interdisziplinärer Herausforderungen.

Hybride KI-Architekturen

  • Struktur

    • Kombiniert strukturierte Führung mit kollaborativer Flexibilität; Führungswechsel je nach Aufgabenanforderungen.

  • Hauptmerkmale

    • Dynamische Führung: Die Führung passt sich der Phase der Aufgabe an.

    • Kooperative Führung: Führungskräfte gehen offen auf ihre Kollegen zu.

  • Stärken

    • Vielseitigkeit: Kombiniert die Stärken beider Modelle.

    • Anpassungsfähigkeit: Bewältigt Aufgaben, die sowohl Struktur als auch Kreativität erfordern.

  • Schwächen

    • Komplexität: Für das Ausbalancieren von Führungsrollen und Zusammenarbeit sind robuste Mechanismen erforderlich.

    • Ressourcenmanagement: Anspruchsvoller.

  • Beste Anwendungsfall

    • Vielseitige Aufgaben: Strategische Planung oder Teamprojekte.

    • Dynamische Prozesse: Strukturierte und kreative Anforderungen in Einklang bringen.

Diagramm für Einzel- und Multi-Agenten-Architekturen

Agentenbasierte Frameworks

Agentische Frameworks beziehen sich auf Designarchitekturen oder -modelle, die definieren, wie Agenten (ob künstlich oder natürlich) Aufgaben ausführen, Entscheidungen treffen und mit ihrer Umgebung auf autonome, intelligente Weise interagieren können. Diese Frameworks geben die Struktur und die Richtlinien dafür vor, wie Agenten in verschiedenen Umgebungen arbeiten, denken und sich anpassen.

Reaktive Architekturen

Reaktive Architekturen ordnen Situationen direkt Aktionen zu. Sie sind reflexartig und treffen Entscheidungen auf der Grundlage unmittelbarer Anreize aus der Umgebung, anstatt sich auf Gedächtnis- oder Vorhersagefunktionen zu verlassen. Sie können nicht aus der Vergangenheit lernen oder für die Zukunft planen. 

Deliberative Architekturen

Eine beratende Architektur ist ein KI-System, das Entscheidungen auf der Grundlage von Überlegungen, Planung und internen Modellen der Welt trifft. Im Gegensatz zu reaktiven Agenten analysieren deliberative Agenten ihre Umgebung, sagen zukünftige Ergebnisse voraus und treffen fundierte Entscheidungen, bevor sie handeln.

Kognitive Architekturen

Eine kognitive agentenbasierte Architektur ist ein fortschrittliches KI-System, das menschenähnliches Denken, Schlussfolgerungen, Lernen und Entscheidungsfindung nachahmt.

Diese Agenten vereinen Elemente der Wahrnehmung, des Gedächtnisses, des Denkvermögens und der Anpassungsfähigkeit, die jeweils durch einzelne Module repräsentiert werden. Dadurch sind sie in der Lage, in komplexen, unsicheren Umgebungen zu agieren und sich im Laufe der Zeit zu verbessern. Dies ist die fortschrittlichste Art von Agentenarchitektur.

Eine BDI-Architektur (häufig als Modell oder Framework bezeichnet) dient der Modellierung rationaler Entscheidungen in intelligenten Agenten und basiert auf dem BDI-Framework (Glauben, Desirene, Absicht).

Diese Architektur modelliert menschenähnliches Denken in einem BDI-Agenten mit:

  • Überzeugungen (Beliefs, B): Das Wissen des Akteurs über die Welt, das sein Verständnis der Umgebung, der aktuellen Situation und aller sensorischen Daten umfassen kann.

Beispiel: „Die Tür ist geschlossen.“

  • Wünsche (Desires, D): Die Ziele oder Vorgaben des Akteurs, die das darstellen, was er erreichen möchte. Wünsche sind nicht unbedingt Maßnahmen, sondern übergeordnete Ziele.

Beispiel: „Ich möchte den Raum betreten.“

  • Absichten (I): Der Handlungsablauf, zu dem sich der Agent verpflichtet, um seine Wünsche zu erfüllen. Intentionen stellen geplante Handlungen dar, die der Agent unter Berücksichtigung seiner Überzeugungen und Wünsche aktiv verfolgt.

Beispiel: „Ich werde die Tür öffnen, um den Raum zu betreten.“

Fußnoten

1 Bandura A. „Social kognitive theory: an agentic perspective.“ Annu Rev Psychol. 2001;52:1-26. DOI: 10.1146/annurev.psych.52.1.1. https://pubmed.ncbi.nlm.nih.gov/11148297/.

2 Bandura A. „Social kognitive theory: an agentic perspective.“

3 T. Masterman, S. Besen, M. Sawtell und A. Chao, „The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey“, arXiv preprint arXiv:2404,11584, Apr. 2024. [Online]. Verfügbar: https://arxiv.org/abs/2404.11584.

4 E. H. Durfee und V. Lesser, „Negotiating Task Decomposition and Allocation Using Partial Global Planning“, in Distributed Artificial Intelligence Volume II, Hrsg. L. Gasser und M. Hühners (London: Pitman Publishing; San Matthias, CA: Morgan Kaufmann, 1989), 229–244.

5 Masterman, et al, „, „The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey.“

6 Masterman, et al., „, „The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey.“

Weiterführende Lösungen
Entwicklung von IBM KI-Agenten 

Ermöglichen Sie Entwicklern die Erstellung, Bereitstellung und Überwachung von KI-Agenten mit dem IBM watsonx.ai Studio.

watsonx.ai erkunden
IBM KI-Agenten und -Assistenten

Erzielen Sie bahnbrechende Produktivität mit einem der branchenweit umfassendsten Funktionenpakete, das Unternehmen bei der Erstellung, Anpassung und Verwaltung von KI-Agenten und KI-Assistenten unterstützt. 

Erkunden Sie KI-Agenten
IBM Granite

Erzielen Sie Kosteneinsparungen von über 90 % mit den kleineren und offenen Modellen von Granite, die auf Entwicklereffizienz ausgelegt sind. Diese auf Unternehmen abgestimmten Modelle bieten eine herausragende Leistung bei Sicherheitsbenchmarks und in einem breiten Spektrum von Unternehmensaufgaben von Cybersicherheit bis RAG.

Granite erkunden
Machen Sie den nächsten Schritt

Automatisieren Sie Ihre komplexen Workflows und erzielen Sie bahnbrechende Produktivität mit einem der branchenweit umfassendsten Funktionspakete, das Unternehmen bei der Erstellung, Anpassung und Verwaltung von KI-Agenten und KI-Assistenten unterstützt. 

watsonx.ai Agentenentwicklung erkunden Entdecken Sie watsonx Orchestrate