Was sind KI-Agentenprotokolle?

Autoren

Staff Writer

IBM Think

Staff Editor, AI Models

IBM Think

KI-Agentenprotokolle legen Standards für die Kommunikation zwischen Agenten der künstlichen Intelligenz sowie zwischen KI-Agenten und anderen Systemen fest. Diese Protokolle spezifizieren die Syntax, Struktur und Reihenfolge von Nachrichten sowie Kommunikationskonventionen, z. B. die Rollen, die Agenten in Konversationen einnehmen, und wann und wie sie auf Nachrichten reagieren.

Agentische KI-Systeme werden oft in Silos ausgeführt. Sie werden von verschiedenen Anbietern erstellt, die unterschiedliche KI-Agent-Frameworks verwenden und unterschiedliche Agentenarchitekturen verwenden. Die Integration in der realen Welt wird zu einer Herausforderung, und die Kopplung dieser fragmentierten Systeme erfordert maßgeschneiderte Konnektoren für alle möglichen Arten der Agenteninteraktion.

Hier kommen die Protokolle ins Spiel. Sie verwandeln unterschiedliche Systeme mit mehreren Agenten in ein vernetztes Ökosystem, in dem KI-gestützte Agenten gemeinsam die Möglichkeit haben, sich gegenseitig zu entdecken, zu verstehen und miteinander zusammenzuarbeiten.

Agentische Protokolle sind zwar Teil der KI-Agentenorchestrierung, fungieren jedoch nicht als Orchestratoren. Sie standardisieren die Kommunikation, verwalten aber nicht die Koordination, Ausführung und Optimierung der agentischen Workflows.

Vorteile von KI-Agentenprotokollen

KI-Agentenprotokolle bieten diese Vorteile:

Interoperabilität
Weniger Komplexität bei der Agentenentwicklung
Standardisierung und reibungslosere Integration

Interoperabilität

Agentenprotokolle brechen Silos auf und ermöglichen es der agentischen KI, unabhängig von ihrer eigenen zugrundeliegenden Implementierung miteinander zu kommunizieren. Sie ermöglichen die nahtlose Zusammenarbeit der Agenten über verschiedene Geräte, Umgebungen und Plattformen hinweg.

Reduzierte Komplexität bei der Agentenentwicklung

Da Protokolle die Feinheiten der Agenteninteraktion behandeln und die Komplexität mithilfe von Software Development Kits (SDKs) abstrahieren, helfen sie dabei, den Prozess der Erstellung von Systemen mit mehreren Agenten zu rationalisieren. KI-Entwickler können sich mehr auf die Entwicklung neuer und die Verbesserung bestehender Agentenfunktionen konzentrieren.

Standardisierung und reibungslosere Integration

KI-Agentenprotokolle bieten ein festgelegtes und strukturiertes Kommunikationsmittel. Und da viele dieser standardisierten Protokolle auf etablierten Technologien aufbauen, gewährleisten sie die Kompatibilität mit aktuellen Technologie-Stack und ermöglichen so eine reibungslosere Unternehmens-Integration.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Beispiele für KI-Agentenprotokolle

Viele Protokolle befinden sich noch in einem frühen Stadium, sodass sie noch nicht weit verbreitet oder in großem Maßstab angewendet werden müssen. Dieser Mangel an Reife bedeutet, dass Unternehmen darauf vorbereitet sein müssen, als Early Adopter zu agieren und sich an bahnbrechende Veränderungen und sich entwickelnde Spezifikationen anzupassen.

Mit der Weiterentwicklung der Agententechnologie könnten auch neue Protokolle entstehen. Hier sind einige aktuelle KI-Agentenprotokolle:

Agent2Agent (A2A)-Protokoll
Agent Communication Protocol (ACP)
Agent Network Protocol (ANP)
Agent-Benutzer-Interaktionsprotokoll (AG-UI)
Agora
LMOS-Protokoll
Model Context Protocol (MCP)

Ein Flussdiagramm, das die Interaktion zwischen einem Benutzer, einer Anwendungs-Benutzeroberfläche und einem Multiagentensystem veranschaulicht.

Agent2Agent (A2A)-Protokoll

Das A2A-Protokoll ist ein offener Standard für die KI-Agentenkommunikation der ursprünglich von Google eingeführt wurde und nun im Rahmen der Linux Foundation verwaltet wird. Es folgt einem Client-Server-Modell, das mit einem dreistufigen Workflow eingerichtet wird:

Eine Entdeckung erfolgt, wenn eine Entität (ein menschlicher Benutzer oder ein KI-Agent) eine Aufgabenanfrage an einen Kundenagenten initiiert, der dann nach Remote-Agenten sucht, um die beste Lösung zu ermitteln.
Sobald der Client-Agent einen Remote-Agenten identifiziert hat, der die Aufgabe erfüllen kann, erfolgt eine Authentifizierung. Der Remote-Agent ist für die Autorisierung und das Erteilen von Zugriffssteuerungsberechtigungen verantwortlich.
Die Kommunikation läuft so ab, dass der Client-Agent die Aufgabe sendet und der Remote-Agent sie bearbeitet. Die Agent-zu-Agent-Kommunikation erfolgt über HTTPS, um die Übertragung zu sichern, mit JSON-RPC (Remote Procedure Call) 2.0 als Format für den Datenaustausch.

Agent Communication Protocol (ACP)

Wie A2A ist auch das Agent Communication Protocol (ACP) ein weiterer offener Standard für die Agent-zu-Agent-Kommunikation, der ursprünglich von IBMs BeeAI eingeführt wurde und nun Teil der Linux Foundation ist.

Zu den Hauptkomponenten gehören ein ACP-Client und ein ACP-Server. Der ACP-Client sendet Anforderungen über eine RESTful-API über HTTP an den ACP-Server. Der ACP-Server hostet einen oder mehrere Agenten hinter einem einzelnen HTTP-Endgerät und leitet Aufgaben an den entsprechenden Agenten weiter.

Hier sind die weiteren wichtigen Funktionen von ACP:

Das Protokoll kann mit Standard-HTTP-Tools wie Postman oder sogar einem Browser verwendet werden, aber auch SDKs sind verfügbar.
Die Erkennung kann online durch direkte Abfrage von ACP-Servern und öffentlichen Manifestdateien unter bekannten URLs erfolgen. Die Offlineermittlung erfolgt über eine zentrale Registrierung oder durch direktes Einbetten von Agent-Metadaten in ihre Distributionspakete.
ACP akzeptiert verschiedene Nachrichtentypen, wie z. B. Audio, Bilder, Text, Video oder benutzerdefinierte Binärformate.

Agenten-Netzwerkprotokoll (ANP)

Das Agent Network Protocol (ANP) ist ein Open-Source-Protokoll, das „das HTTP der Agenten-Web-Ära“ sein soll. Daher werden HTTP für den Datentransport und JSON-LD (JSON für Linked Data) für die Datenformatierung verwendet.

ANP verwendet eine Peer-to-Peer-Architektur, die aus drei Schichten besteht:

Der Identity Layer implementiert sowohl eine Ende-zu-Ende-Verschlüsselung für eine sichere Kommunikation als auch eine dezentrale Identitätsauthentifizierung auf Basis des W3C DID (Decentralized Identifiers) Standards.
Die Meta-Protokoll-Schicht ermöglicht es den Agenten, zu verhandeln und sich auf die Art und Weise der Kommunikation zu einigen.
Die Anwendungsprotokollschicht ermöglicht autonomen Agenten die Beschreibung ihrer Funktionen und unterstützt die Agentenerkennung.

Agent-Benutzer-Interaktionsprotokoll (AG-UI)

Das Agent-User Interaction (AG-UI)-Protokoll soll standardisieren, wie sich Back-End-KI-Agenten mit Front-End- oder benutzerorientierten Anwendungen verbinden. Es wurde für die Interaktion zwischen Mensch und Agent in Echtzeit entwickelt, wie z. B.Chats mit KI-Assistenten und Chatbots, Live-Streaming von Statusaktualisierungen und andere agentenbasierte Automatisierungen, die einen Human-in-the-Loop-Ansatz beinhalten.

Die ereignisgesteuerte Architektur von AG-Benutzeroberfläche ermöglicht es KI-Agenten, Ereignisse auf der Grundlage bestimmter Systemauslöser oder Benutzereingaben zu erzeugen. Das Protokoll definiert eine Reihe von Categories, einschließlich solcher für das Senden und Empfangen von Nachrichten, das Aufrufen von Tools und das Erledigen von Aufgaben.

Die Middleware-Schicht unterstützt verschiedene Transportmethoden wie Server-Sent Events (SSE), Webhooks und WebSockets. AG-UI ermöglicht auch einen sicheren Proxy, um Anfragen sicher zwischen Agenten und Benutzeroberflächen weiterzuleiten.

Agora

Agora ist ein Kommunikationsprotokoll für Agenten, die auf großen Sprachmodellen (LLMs) basieren. Es stützt sich auf einige Kernfunktionen des LLM-Agenten: Natural Language Understanding, Befolgen von Anweisungen, Schreiben und Ausführen von Code und autonome Aushandlung.

LLM-Agenten können ihre eigenen Protokolle implementieren und unterstützen, die sie in Klartext in einem Protokolldokument beschreiben. Der erste Teil des Dokuments enthält Metadaten, die den Namen des Protokolls, die Beschreibung und die Frage identifizieren, ob es sich um eine einzelne oder mehrere Gesprächsrunden handelt. Der zweite Teil beschreibt, wie die Kommunikation stattfindet, mit Anweisungen in einer Mischung aus natürlicher Sprache und Code. Die Agenten müssen dann selbständig aushandeln, welches Protokoll sie wählen.

Agora verwendet HTTPS zur Übertragung von Daten und JSON für die Formatierung. Es verwendet auch ein Hash-basiertes Identifizierungssystem für Protokolldokumente.

LMOS-Protokoll

Das von der Eclipse Foundation entwickelte Language Model Operating System (LMOS)-Protokoll zielt darauf ab, ein Internet of Agents (IoA) zu etablieren – ein Multi-Agent-Ökosystem im Internet. Ähnlich wie bei ANP besteht seine strukturierte Architektur aus drei Schichten:

Die Identitäts- und Sicherheitsschicht bietet eine verschlüsselte Kommunikation und unterstützt verschiedene Authentifizierungsschemata, z. B. W3C DID und OAuth 2.0.
Die Transportprotokollschicht ermöglicht es den Agenten, das für ihre Zwecke geeignete Transportprotokoll für jede Interaktion auszuwählen und anzupassen.
Die Anwendungsschicht beschreibt Formate für Agenten- und Toolbeschreibungen, Erkennungsmethoden, ein semantisches Datenmodell und ein Websocket-Unterprotokoll.

Das LMOS-Protokoll verwendet JSON-LD zur Beschreibung von Tool- und Agent-Funktionen und anderen Metadaten. Die Erkennung erfolgt entweder dynamisch, durch Abfragen eines zentralen Verzeichnisses oder über dezentrale Netzwerke.

Model Context Protocol (MCP)

Das von Anthropic eingeführte Model Context Protocol (MCP) bietet eine standardisierte Möglichkeit für KI-Modelle, den Kontext zu erhalten, den sie für die Ausführung von Aufgaben benötigen. Im Agentenbereich fungiert MCP als Stufe für KI-Agenten, um sich mit externen Diensten und Tools wie APIs, Datenbanken, Dateien, Internetsuchen und anderen Datenquellen zu verbinden und mit ihnen zu kommunizieren.

MCP umfasst diese drei wichtigen Architekturelemente:

Der MCP-Host enthält Orchestrierungslogik und kann jeden MCP-Client mit einem MCP-Server verbinden. Es können mehrere Clients gehostet werden.
Ein MCP-Client konvertiert Benutzeranforderungen in ein strukturiertes Format, das das Protokoll verarbeiten kann. Jeder Client verfügt über eine 1:1-Beziehung mit einem MCP-Server. Kunden verwalten Sitzungen, analysieren und Verify Antworten und behandeln Fehler.
Der MCP-Server wandelt Benutzeranfragen in Serveraktionen um. Server sind in der Regel GitHub-Repositorys, die in verschiedenen Programmiersprachen verfügbar sind und Zugriff auf Tools bieten. Sie können auch verwendet werden, um LLM-Inferenzen über KI-Plattformanbieter wie IBM und OpenAI mit dem MCP SDK zu verbinden.

In der Transportschicht zwischen Clients und Servern werden Nachrichten im JSON-RPC 2.0-Format übertragen, wobei entweder Standard Input/Output (stdio) für schlankes, synchrones Messaging oder SSE für asynchrone, ereignisgesteuerte Aufrufe verwendet werden.

KI-Agenten

5 Arten von KI-Agenten: Autonome Funktionen und Anwendungen in der echten Welt

Erfahren Sie, wie sich zielgerichtete und dienstprogrammbasierte KI an Workflows und komplexe Umgebungen anpassen kann.

Erstellen, bereitstellen und überwachen Sie KI-Agenten

Wichtige Faktoren bei der Auswahl eines KI-Agentenprotokolls

Da es keine Benchmarks für standardisierte Bewertungen gibt, müssen Unternehmen selbst das Protokoll prüfen, das ihren Geschäftsanforderungen am besten entspricht. Möglicherweise müssen sie mit einem kleinen und kontrollierten Anwendungsfall in Kombination mit gründlichen und strengen Tests beginnen.

Hier sind einige Aspekte, die Sie bei der Bewertung von Agentenprotokollen berücksichtigen sollten:

Effizienz
Reliabilität
Skalierbarkeit
Sicherheit

Effizienz

Im Idealfall sind die Protokolle so konzipiert, dass sie die Latenzzeit begrenzen, was zu einer schnellen Datenübertragung und schnellen Antwortzeiten führt. Obwohl ein gewisser Kommunikationsaufwand zu erwarten ist, muss dieser auf ein Minimum reduziert werden.

Zuverlässigkeit

KI-Agentenprotokolle müssen in der Lage sein, mit sich ändernden Netzwerkbedingungen im gesamten Agenten-Workflow umzugehen, und es müssen Mechanismen zur Verwaltung von Ausfällen oder Unterbrechungen vorhanden sein. So ist ACP beispielsweise standardmäßig auf asynchrone Kommunikation ausgelegt, was sich für komplexe oder langwierige Aufgaben eignet. In der Zwischenzeit unterstützt A2A Echtzeit-Streaming mit SSE für große oder lange Ausgaben oder kontinuierliche Statusaktualisierungen.

Skalierbarkeit

Protokolle müssen robust genug sein, um wachsenden Agenten-Ökosystemen gerecht zu werden, ohne dass ihre Leistung darunter leidet. Die Bewertung der Skalierbarkeit kann darin bestehen, die Anzahl der Agenten oder Verbindungen zu externen Tools über einen bestimmten Zeitraum entweder allmählich oder plötzlich zu erhöhen, um zu beobachten, wie ein Protokoll unter diesen Bedingungen funktioniert.

Sicherheit

Die Aufrechterhaltung der Sicherheit ist von größter Bedeutung, und Agentenprotokolle enthalten zunehmend Sicherheitsrichtlinien. Dazu gehören Authentifizierung, Verschlüsselung und Zugriffskontrolle.

ROI realisieren: Ein praktischer Leitfaden für agentische KI

Erfahren Sie, wie Sie agentische KI skalieren, um einen messbaren ROI in Ihrem gesamten Unternehmen zu erzielen. Dieses Playbook beschreibt die größten Hindernisse, die einschränken, wie man den ROI effektiv misst, und bietet ein praktisches Framework für eine erfolgreiche, unternehmensweite Einführung.

Ressourcen

Enterprise 2030: Entwickelt für kontinuierliche Innovation.

Entdecken Sie unsere fünf Prognosen über die erfolgreichsten Unternehmen im Jahr 2030 und die nötigen Schritte für Führungskräfte, um sich KI-Vorteile zu verschaffen.

Gebot der KI-Governance: Sich entwickelnde Regulierungen und das Aufkommen agentischer KI

Erfahren Sie, wie sich ändernde Vorschriften und das Aufkommen von KI-Agenten den Bedarf an robusten KI-Governance-Frameworks verändern.

Agentische KI erklärt

„Techsplainers“ von IBM schlüsselt die Grundlagen der agentischen KI auf, von Schlüsselkonzepten bis hin zu realen Anwendungsfällen. Klare, kurze Episoden helfen Ihnen, die Grundlagen schnell zu erlernen.

ROI durch KI generieren: Ein taktischer Leitfaden für die Produktivität im Unternehmen

Erfahren Sie mehr über bewährte Strategien, um die Produktivität zu steigern und die Transformation von Unternehmen mit Blick auf KI und Innovation voranzutreiben.

Wie Ihr Unternehmen von KI-Agenten und -Assistenten profitieren kann

Tauchen Sie ein in diesen umfassenden Leitfaden, der die wichtigsten Anwendungsfälle und Kernfunktionen aufschlüsselt und Ihnen Schritt für Schritt Empfehlungen für die Auswahl der richtigen Lösungen für Ihr Unternehmen gibt.

Mit KI-Agenten und -Assistenten die Produktivität von Unternehmen neu definieren

Erfahren Sie, wie KI-Agenten und KI-Assistenten zusammenwirken können, um neue Produktivitätsniveaus zu erreichen.

watsonx Orchestrate™ testen

Erfahren Sie, wie generative KI-Assistenten Ihre Workloads erleichtern und die Produktivität steigern können.

Von KI-Projekten zu Gewinnen: Wie agentische KI finanzielle Erträge sichern kann

Erfahren Sie, wie Unternehmen von der KI-Einführung in verteilten Pilotprojekten zu ihrer Nutzung übergehen, um die Transformation im Kern voranzutreiben.

Omdia-Bericht über handlungsfähige Intelligenz: Die Auswirkungen von KI-Agenten

Entdecken Sie, wie Sie sich das volle Potenzial von der generativen KI mit KI-Agenten erschließen können.

Wie KI-Agenten die Produktivität neu definieren

Lernen Sie, wie Sie mithilfe von KI kreativer und effizienter werden und sich auf eine Zukunft einstellen können, in der Sie eng mit KI-Agenten zusammenarbeiten.

Das Zeitalter der agentischen Unternehmen: Einsatz von KI in Ihrem gesamten Technologiebestand

Bleiben Sie über die neuen KI-Agenten auf dem Laufenden, die einen grundlegenden Wendepunkt in der KI-Revolution darstellen.

Die Zukunft der Agenten, der Energieverbrauch der KI, die Computernutzung von Anthropic und das Wasserzeichen von Google für KI-generierten Text

Bringen Sie sich in dieser Folge von Mixture of Experts mit unseren KI-Experten auf den neuesten Stand, wenn sie sich eingehend mit der Zukunft von KI-Agenten und mehr befassen.

Wie Comparus einen „Bankassistenten“ einsetzt

Comparus nutzte Lösungen von watsonx.ai und präsentierte eindrucksvoll das Potenzial von dialogorientiertem Banking als neues Interaktionsmodell.

Weiterführende Lösungen

KI-Agenten für Unternehmen

Entwickeln, implementieren und verwalten Sie leistungsstarke KI-Assistenten und -Agenten, die Workflows und Prozesse mit generativer KI automatisieren.

Entdecken Sie watsonx Orchestrate

IBM KI-Agenten-Lösungen

Gestalten Sie die Zukunft Ihres Unternehmens mit KI-Lösungen, denen Sie vertrauen können.

KI-Agenten-Lösungen erkunden

IBM Consulting KI-Dienstleistungen

Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.

Erkunden Sie die Services im Bereich der künstlichen Intelligenz

Machen Sie den nächsten Schritt

Ganz gleich, ob Sie vorgefertigte Apps und Skills anpassen oder mithilfe eines KI-Studios eigene Agentenservices erstellen und bereitstellen möchten, die IBM watsonx-Plattform bietet Ihnen alles, was Sie brauchen.