Was sind KI-Agentenprotokolle?

Autoren

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

KI-Agentenprotokolle legen Standards für die Kommunikation zwischen Agenten der künstlichen Intelligenz sowie zwischen KI-Agenten und anderen Systemen fest. Diese Protokolle spezifizieren die Syntax, Struktur und Reihenfolge von Nachrichten sowie Kommunikationskonventionen, z. B. die Rollen, die Agenten in Konversationen einnehmen, und wann und wie sie auf Nachrichten reagieren.

Agentische KI-Systeme werden oft in Silos ausgeführt. Sie werden von verschiedenen Anbietern erstellt, die unterschiedliche KI-Agent-Frameworks verwenden und unterschiedliche Agentenarchitekturen verwenden. Die Integration in der realen Welt wird zu einer Herausforderung, und die Kopplung dieser fragmentierten Systeme erfordert maßgeschneiderte Konnektoren für alle möglichen Arten der Agenteninteraktion.

Hier kommen die Protokolle ins Spiel. Sie verwandeln unterschiedliche Systeme mit mehreren Agenten in ein vernetztes Ökosystem, in dem KI-gestützte Agenten gemeinsam die Möglichkeit haben, sich gegenseitig zu entdecken, zu verstehen und miteinander zusammenzuarbeiten.

Agentische Protokolle sind zwar Teil der KI-Agentenorchestrierung, fungieren jedoch nicht als Orchestratoren. Sie standardisieren die Kommunikation, verwalten aber nicht die Koordination, Ausführung und Optimierung der agentischen Workflows.

Vorteile von KI-Agentenprotokollen

KI-Agentenprotokolle bieten diese Vorteile:

  • Interoperabilität

  • Weniger Komplexität bei der Agentenentwicklung

  • Standardisierung und reibungslosere Integration

Interoperabilität

Agentenprotokolle brechen Silos auf und ermöglichen es der agentischen KI, unabhängig von ihrer eigenen zugrundeliegenden Implementierung miteinander zu kommunizieren. Sie ermöglichen die nahtlose Zusammenarbeit der Agenten über verschiedene Geräte, Umgebungen und Plattformen hinweg.

Reduzierte Komplexität bei der Agentenentwicklung

Da Protokolle die Feinheiten der Agenteninteraktion behandeln und die Komplexität mithilfe von Software Development Kits (SDKs) abstrahieren, helfen sie dabei, den Prozess der Erstellung von Systemen mit mehreren Agenten zu rationalisieren. KI-Entwickler können sich mehr auf die Entwicklung neuer und die Verbesserung bestehender Agentenfunktionen konzentrieren.

Standardisierung und reibungslosere Integration

KI-Agentenprotokolle bieten ein festgelegtes und strukturiertes Kommunikationsmittel. Und da viele dieser standardisierten Protokolle auf etablierten Technologien aufbauen, gewährleisten sie die Kompatibilität mit aktuellen Technologie-Stack und ermöglichen so eine reibungslosere Unternehmens-Integration.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Beispiele für KI-Agentenprotokolle

Viele Protokolle befinden sich noch in einem frühen Stadium, sodass sie noch nicht weit verbreitet oder in großem Maßstab angewendet werden müssen. Dieser Mangel an Reife bedeutet, dass Unternehmen darauf vorbereitet sein müssen, als Early Adopter zu agieren und sich an bahnbrechende Veränderungen und sich entwickelnde Spezifikationen anzupassen.

Mit der Weiterentwicklung der Agententechnologie könnten auch neue Protokolle entstehen. Hier sind einige aktuelle KI-Agentenprotokolle:

  • Agent2Agent (A2A)-Protokoll

  • Agent Communication Protocol (ACP)

  • Agent Network Protocol (ANP)

  • Agent-Benutzer-Interaktionsprotokoll (AG-UI)

  • Agora

  • LMOS-Protokoll

  • Model Context Protocol (MCP) 

Ein Flussdiagramm, das die Interaktion zwischen einem Benutzer, einer Anwendungs-Benutzeroberfläche und einem Multiagentensystem veranschaulicht.

Agent2Agent (A2A)-Protokoll

Das A2A-Protokoll ist ein offener Standard für die KI-Agentenkommunikation der ursprünglich von Google eingeführt wurde und nun im Rahmen der Linux Foundation verwaltet wird. Es folgt einem Client-Server-Modell, das mit einem dreistufigen Workflow eingerichtet wird:

  1. Eine Entdeckung erfolgt, wenn eine Entität (ein menschlicher Benutzer oder ein KI-Agent) eine Aufgabenanfrage an einen Kundenagenten initiiert, der dann nach Remote-Agenten sucht, um die beste Lösung zu ermitteln.
  2. Sobald der Client-Agent einen Remote-Agenten identifiziert hat, der die Aufgabe erfüllen kann, erfolgt eine Authentifizierung. Der Remote-Agent ist für die Autorisierung und das Erteilen von Zugriffssteuerungsberechtigungen verantwortlich.
  3. Die Kommunikation läuft so ab, dass der Client-Agent die Aufgabe sendet und der Remote-Agent sie bearbeitet. Die Agent-zu-Agent-Kommunikation erfolgt über HTTPS, um die Übertragung zu sichern, mit JSON-RPC (Remote Procedure Call) 2.0 als Format für den Datenaustausch.

Agent Communication Protocol (ACP)

Wie A2A ist auch das Agent Communication Protocol (ACP) ein weiterer offener Standard für die Agent-zu-Agent-Kommunikation, der ursprünglich von IBMs BeeAI eingeführt wurde und nun Teil der Linux Foundation ist.

Zu den Hauptkomponenten gehören ein ACP-Client und ein ACP-Server. Der ACP-Client sendet Anforderungen über eine RESTful-API über HTTP an den ACP-Server. Der ACP-Server hostet einen oder mehrere Agenten hinter einem einzelnen HTTP-Endgerät und leitet Aufgaben an den entsprechenden Agenten weiter.

Hier sind die weiteren wichtigen Funktionen von ACP:

  • Das Protokoll kann mit Standard-HTTP-Tools wie Postman oder sogar einem Browser verwendet werden, aber auch SDKs sind verfügbar.

  • Die Erkennung kann online durch direkte Abfrage von ACP-Servern und öffentlichen Manifestdateien unter bekannten URLs erfolgen. Die Offlineermittlung erfolgt über eine zentrale Registrierung oder durch direktes Einbetten von Agent-Metadaten in ihre Distributionspakete.

  • ACP akzeptiert verschiedene Nachrichtentypen, wie z. B. Audio, Bilder, Text, Video oder benutzerdefinierte Binärformate.

Agenten-Netzwerkprotokoll (ANP)

Das Agent Network Protocol (ANP) ist ein Open-Source-Protokoll, das „das HTTP der Agenten-Web-Ära“ sein soll. Daher werden HTTP für den Datentransport und JSON-LD (JSON für Linked Data) für die Datenformatierung verwendet.

ANP verwendet eine Peer-to-Peer-Architektur, die aus drei Schichten besteht:

  • Der Identity Layer implementiert sowohl eine Ende-zu-Ende-Verschlüsselung für eine sichere Kommunikation als auch eine dezentrale Identitätsauthentifizierung auf Basis des W3C DID (Decentralized Identifiers) Standards.

  • Die Meta-Protokoll-Schicht ermöglicht es den Agenten, zu verhandeln und sich auf die Art und Weise der Kommunikation zu einigen.

  • Die Anwendungsprotokollschicht ermöglicht autonomen Agenten die Beschreibung ihrer Funktionen und unterstützt die Agentenerkennung.

Agent-Benutzer-Interaktionsprotokoll (AG-UI)

Das Agent-User Interaction (AG-UI)-Protokoll soll standardisieren, wie sich Back-End-KI-Agenten mit Front-End- oder benutzerorientierten Anwendungen verbinden. Es wurde für die Interaktion zwischen Mensch und Agent in Echtzeit entwickelt, wie z. B.Chats mit KI-Assistenten und Chatbots, Live-Streaming von Statusaktualisierungen und andere agentenbasierte Automatisierungen, die einen Human-in-the-Loop-Ansatz beinhalten.

Die ereignisgesteuerte Architektur von AG-Benutzeroberfläche ermöglicht es KI-Agenten, Ereignisse auf der Grundlage bestimmter Systemauslöser oder Benutzereingaben zu erzeugen. Das Protokoll definiert eine Reihe von Categories, einschließlich solcher für das Senden und Empfangen von Nachrichten, das Aufrufen von Tools und das Erledigen von Aufgaben.

Die Middleware-Schicht unterstützt verschiedene Transportmethoden wie Server-Sent Events (SSE), Webhooks und WebSockets. AG-UI ermöglicht auch einen sicheren Proxy, um Anfragen sicher zwischen Agenten und Benutzeroberflächen weiterzuleiten.

Agora

Agora ist ein Kommunikationsprotokoll für Agenten, die auf großen Sprachmodellen (LLMs) basieren. Es stützt sich auf einige Kernfunktionen des LLM-Agenten: Natural Language Understanding, Befolgen von Anweisungen, Schreiben und Ausführen von Code und autonome Aushandlung.

LLM-Agenten können ihre eigenen Protokolle implementieren und unterstützen, die sie in Klartext in einem Protokolldokument beschreiben. Der erste Teil des Dokuments enthält Metadaten, die den Namen des Protokolls, die Beschreibung und die Frage identifizieren, ob es sich um eine einzelne oder mehrere Gesprächsrunden handelt. Der zweite Teil beschreibt, wie die Kommunikation stattfindet, mit Anweisungen in einer Mischung aus natürlicher Sprache und Code. Die Agenten müssen dann selbständig aushandeln, welches Protokoll sie wählen.

Agora verwendet HTTPS zur Übertragung von Daten und JSON für die Formatierung. Es verwendet auch ein Hash-basiertes Identifizierungssystem für Protokolldokumente.

LMOS-Protokoll

Das von der Eclipse Foundation entwickelte Language Model Operating System (LMOS)-Protokoll zielt darauf ab, ein Internet of Agents (IoA) zu etablieren – ein Multi-Agent-Ökosystem im Internet. Ähnlich wie bei ANP besteht seine strukturierte Architektur aus drei Schichten:

  • Die Identitäts- und Sicherheitsschicht bietet eine verschlüsselte Kommunikation und unterstützt verschiedene Authentifizierungsschemata, z. B. W3C DID und OAuth 2.0.

  • Die Transportprotokollschicht ermöglicht es den Agenten, das für ihre Zwecke geeignete Transportprotokoll für jede Interaktion auszuwählen und anzupassen.

  • Die Anwendungsschicht beschreibt Formate für Agenten- und Toolbeschreibungen, Erkennungsmethoden, ein semantisches Datenmodell und ein Websocket-Unterprotokoll.

Das LMOS-Protokoll verwendet JSON-LD zur Beschreibung von Tool- und Agent-Funktionen und anderen Metadaten. Die Erkennung erfolgt entweder dynamisch, durch Abfragen eines zentralen Verzeichnisses oder über dezentrale Netzwerke.

Model Context Protocol (MCP)

Das von Anthropic eingeführte Model Context Protocol (MCP) bietet eine standardisierte Möglichkeit für KI-Modelle, den Kontext zu erhalten, den sie für die Ausführung von Aufgaben benötigen. Im Agentenbereich fungiert MCP als Stufe für KI-Agenten, um sich mit externen Diensten und Tools wie APIs, Datenbanken, Dateien, Internetsuchen und anderen Datenquellen zu verbinden und mit ihnen zu kommunizieren.

MCP umfasst diese drei wichtigen Architekturelemente:

  • Der MCP-Host enthält Orchestrierungslogik und kann jeden MCP-Client mit einem MCP-Server verbinden. Es können mehrere Clients gehostet werden.

  • Ein MCP-Client konvertiert Benutzeranforderungen in ein strukturiertes Format, das das Protokoll verarbeiten kann. Jeder Client verfügt über eine 1:1-Beziehung mit einem MCP-Server. Kunden verwalten Sitzungen, analysieren und Verify Antworten und behandeln Fehler.

  • Der MCP-Server wandelt Benutzeranfragen in Serveraktionen um. Server sind in der Regel GitHub-Repositorys, die in verschiedenen Programmiersprachen verfügbar sind und Zugriff auf Tools bieten. Sie können auch verwendet werden, um LLM-Inferenzen über KI-Plattformanbieter wie IBM und OpenAI mit dem MCP SDK zu verbinden.

In der Transportschicht zwischen Clients und Servern werden Nachrichten im JSON-RPC 2.0-Format übertragen, wobei entweder Standard Input/Output (stdio) für schlankes, synchrones Messaging oder SSE für asynchrone, ereignisgesteuerte Aufrufe verwendet werden.

KI-Agenten

5 Arten von KI-Agenten: Autonome Funktionen und Anwendungen in der echten Welt

Erfahren Sie, wie sich zielgerichtete und dienstprogrammbasierte KI an Workflows und komplexe Umgebungen anpassen kann.

Wichtige Faktoren bei der Auswahl eines KI-Agentenprotokolls

Da es keine Benchmarks für standardisierte Bewertungen gibt, müssen Unternehmen selbst das Protokoll prüfen, das ihren Geschäftsanforderungen am besten entspricht. Möglicherweise müssen sie mit einem kleinen und kontrollierten Anwendungsfall in Kombination mit gründlichen und strengen Tests beginnen.

Hier sind einige Aspekte, die Sie bei der Bewertung von Agentenprotokollen berücksichtigen sollten:

  • Effizienz

  • Reliabilität

  • Skalierbarkeit

  • Sicherheit

Effizienz

Im Idealfall sind die Protokolle so konzipiert, dass sie die Latenzzeit begrenzen, was zu einer schnellen Datenübertragung und schnellen Antwortzeiten führt. Obwohl ein gewisser Kommunikationsaufwand zu erwarten ist, muss dieser auf ein Minimum reduziert werden.

Zuverlässigkeit

KI-Agentenprotokolle müssen in der Lage sein, mit sich ändernden Netzwerkbedingungen im gesamten Agenten-Workflow umzugehen, und es müssen Mechanismen zur Verwaltung von Ausfällen oder Unterbrechungen vorhanden sein. So ist ACP beispielsweise standardmäßig auf asynchrone Kommunikation ausgelegt, was sich für komplexe oder langwierige Aufgaben eignet. In der Zwischenzeit unterstützt A2A Echtzeit-Streaming mit SSE für große oder lange Ausgaben oder kontinuierliche Statusaktualisierungen.

Skalierbarkeit

Protokolle müssen robust genug sein, um wachsenden Agenten-Ökosystemen gerecht zu werden, ohne dass ihre Leistung darunter leidet. Die Bewertung der Skalierbarkeit kann darin bestehen, die Anzahl der Agenten oder Verbindungen zu externen Tools über einen bestimmten Zeitraum entweder allmählich oder plötzlich zu erhöhen, um zu beobachten, wie ein Protokoll unter diesen Bedingungen funktioniert.

Sicherheit

Die Aufrechterhaltung der Sicherheit ist von größter Bedeutung, und Agentenprotokolle enthalten zunehmend Sicherheitsrichtlinien. Dazu gehören Authentifizierung, Verschlüsselung und Zugriffskontrolle.

Weiterführende Lösungen
KI-Agenten für Unternehmen

Entwickeln, implementieren und verwalten Sie leistungsstarke KI-Assistenten und -Agenten, die Workflows und Prozesse mit generativer KI automatisieren.

    Entdecken Sie watsonx Orchestrate
    IBM KI-Agenten-Lösungen

    Gestalten Sie die Zukunft Ihres Unternehmens mit KI-Lösungen, denen Sie vertrauen können.

    KI-Agenten-Lösungen erkunden
    IBM Consulting KI-Dienstleistungen

    Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.

    Erkunden Sie die Services im Bereich der künstlichen Intelligenz
    Machen Sie den nächsten Schritt

    Ganz gleich, ob Sie vorgefertigte Apps und Skills anpassen oder mithilfe eines KI-Studios eigene Agentenservices erstellen und bereitstellen möchten, die IBM watsonx-Plattform bietet Ihnen alles, was Sie brauchen.

    Entdecken Sie watsonx Orchestrate watsonx.ai erkunden