AgentGPT ist eine browserbasierte Open Source-Plattform für KI, mit der Benutzer autonome KI-Agenten erstellen, konfigurieren und bereitstellen können.
Im Gegensatz zu aktuellen Iterationen von ChatGPT von OpenAI können Sie mit AgentGPT autonome KI-Agenten erstellen, die denken, planen, handeln und sich auf ein benutzerdefiniertes Ziel einstellen können, und das mit minimalem manuellem Prompting. Eine Besonderheit von AgentGPT ist seine benutzerfreundliche Oberfläche, die die Funktionen des KI-Agenten für vielfältige Anwendungsfälle zugänglich macht, darunter Recherche und Datenerfassung, explorative Problemlösung, Ideenfindung, die Automatisierung sich wiederholender Aufgaben, die Erstellung von Chatbots und vieles mehr.
AgentGPT ist ein No-Code-Tool, d. h. Benutzer müssen keine Software schreiben oder eine Entwicklungsumgebung einrichten, um ein Ziel zu definieren, ein Modell auszuwählen und Agenten bereitzustellen. Vorlagen werden bereitgestellt, damit Anfänger verstehen, wie man effektive Ziele formuliert.
AgentGPT ist ein Open-Source-Projekt, das hauptsächlich von einem Team bei Reworkd AI entwickelt wurde. Das in San Francisco ansässige Startup brachte das Tool im April 2023 auf den Markt und betreut es weiterhin. Hinsichtlich der Preisgestaltung bietet Reworkd sowohl eine kostenlose Version als auch einen gehosteten Service mit kostenpflichtigen Tarifen an. Das Projekt erlangte frühzeitig Aufmerksamkeit, unter anderem weil es offen und zugänglich war; Code und Dokumentation waren auf GitHub verfügbar.
Es ist erwähnenswert, dass „GPT“ in AgentGPT für Generative Pretrained Transformer steht, eine Familie von großen Sprachmodellen (Large Language Models, LLM), die auf einer Transformer Deep-Learning-Architektur basieren. Das Projekt heißt AgentGPT, weil der GPT als autonomer Agent agiert und nicht nur als Chatbot wie bei ChatGPT, obwohl beide unter der Oberfläche auf denselben OpenAI-Modellen wie GPT-3.5 und GPT-4 basieren.
AgentGPT sollte nicht mit anderen agentischen KI-Tools wie AutoGPT verwechselt werden, einem ähnlichen Werkzeug, das auf den privaten Rechnern der Nutzer statt auf dem Web läuft. BabyAGI ist eine weitere agentische Plattform, die eher technisch ausgerichtet und auf Python basiert und häufig als grundlegendes Werkzeug für Entwickler genutzt wird.
Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.
Ein Agent ist ein KI-gestütztes System, das Aufgaben autonom ausführt, indem es Workflows mit verfügbaren Tools entwirft. Herkömmliche LLMs, wie IBM® Granite-Modelle, erstellen ihre Antworten auf der Grundlage der Daten, die zu ihrem Training verwendet wurden, und sind an Wissens- und Argumentationsbeschränkungen gebunden.
Agenten hingegen können weit mehr tun, als nur mit den Nutzern zu sprechen. Ein LLM kann man sich als eine Art Gehirn vorstellen. Ein Agent ist ein System, das mithilfe eines LLM-Modells denkt, um Maßnahmen zu ergreifen. Agenten nutzen ihr Gehirn, um komplexe Aufgaben zu planen und auszuführen, die mehrstufiges logisches Denken erfordern, um langfristige Ziele zu erreichen – und das mit minimalem menschlichem Eingriff.
Nehmen wir einmal an, Sie möchten ein Café eröffnen, wissen aber nicht, was einen guten Standort ausmacht. Sie möchten Kriterien für geeignete Standorte ermitteln, Belege sammeln, die Auswahl an in Frage kommenden Gebieten eingrenzen und Kompromisse sowie Risiken aufzeigen. Ihr Ansprechpartner wird ein Nachwuchs-Analyst sein. Doch welches Tool soll man verwenden? Beide nutzen maschinelles Lernen zur Erstellung von Inhalten, sodass Sie theoretisch ChatGPT (oder einen anderen LLM-basierten Chatbot) für ein solches Projekt einsetzen könnten.
Es ist erwähnenswert, dass die Fähigkeit von AgentGPT, Websuchen in Echtzeit durchzuführen und auf andere externe Tools zuzugreifen, der entsprechenden Funktion von ChatGPT vorausging, obwohl mittlerweile beide Tools über diese Fähigkeit verfügen. Dennoch hat AgentGPT seine Stärken.
ChatGPT eignet sich hervorragend, wenn Sie Nachfragen stellen, Annahmen hinterfragen und Ideen interaktiv herausfordern und verfeinern möchten. Wenn die Aufgabe jedoch aus mehreren Schritten besteht, der Pfad unklar ist und Sie ihn nicht bei jedem Schritt manuell steuern möchten, ist AgentGPT möglicherweise das bessere Tool.
ChatGPT wartet darauf, dass man ihm sagt, was es tun soll, und Sie müssen es bei jedem Schritt anleiten. Im Gegensatz dazu nimmt AgentGPT Ihr ursprüngliches Ziel auf und setzt es eigenständig um, wobei es selbst entscheidet, welche Schritte am besten zu ergreifen sind. Es eignet sich hervorragend dazu, „unbekannte Unbekannte“ aufzudecken und Bereiche zu erkunden, an die Sie vielleicht gar nicht gedacht hätten, danach zu fragen.
Bei ChatGPT müsste man bei jedem Schritt nachfragen:
Mit AgentGPT können Sie einfach sagen: „Finde heraus, was einen guten Standort für ein Café ausmacht“, und der Agent erstellt eine umfassend recherchierte Antwort. Der Agent wird sich solche Fragen selbst stellen und sie proaktiv für Sie beantworten.
Nehmen wir an, Sie möchten einen Agenten erstellen, der neue Vorschriften, Trends und Technologien überwacht, die Cafés betreffen, und wöchentlich Risiken und Chancen zusammenfasst, die Ihnen in einem übersichtlichen Bericht präsentiert werden. Sie möchten, dass der Agent Quellen durchsuchen, nach Relevanz für Cafés filtern, Risiken und Chancen zusammenfassen und die Ergebnisse zusammenfassen kann.
Dies ist ein besserer Anwendungsfall, bei dem AgentGPT sinnvoller ist als ChatGPT, da es flexibler ist und Sie die fertigen Zusammenfassungen einfach durchsehen können, anstatt den Agenten ständig um neue Informationen bitten zu müssen.
Zunächst geben Sie Ihrem Agenten einen Namen (zum Beispiel „Analyst für Risiken und Chancen in der Kaffeeindustrie“). Dann schreiben Sie Ihr Ziel auf:
„Durchsuchen Sie das Internet und die sozialen Medien nach neuen Vorschriften, Trends und Technologien, die unabhängige Cafés betreffen, und fassen Sie wöchentlich Risiken, Chancen und wichtige Punkte zusammen, die es zu beobachten gilt. Überarbeiten und optimieren Sie den Newsletter anschließend für eine Leserschaft aus Führungskräften.“
„Unabhängige Coffeeshops“ schränkt die Relevanz ein. „Risiken, Chancen und zu beobachtende Punkte“ erfordern eine Kategorisierung. „Bearbeiten und optimieren“ reduziert Redundanzen und führt zu Ergebnissen im gewünschten Stil.
Sie können zusätzliche Einschränkungen oder Betriebsregeln hinzufügen, um ungenaue Ergebnisse zu vermeiden. So wie das:
„Konzentrieren Sie sich auf regionale Vorschriften, sofern nicht anders angegeben“
„Ignorieren Sie irrelevante Nachrichten aus dem Gastgewerbe (wie z. B. gehobene Gastronomie, Hotels)“
„Quellen aus den letzten 7 Tagen bevorzugen“
„Auswirkungen klar und präzise zusammenfassen“
„Unsicherheit kennzeichnen, wenn die Informationen unvollständig sind“
Beginnen Sie mit einer Zusammenfassung (nicht mehr als 5 Punkte)
Alle Quellen als Hyperlinks einbetten
Wiederholen Sie die Ergebnisse aus früheren Berichten nicht
„Hype“-Nachrichten bestrafen
Sie können diesen ersten Prompt speichern und wöchentlich erneut ausführen, um neue Ergebnisse zu erhalten.
AgentGPT eignet sich hervorragend für solche einfachen Anwendungsfälle, die unter die Kategorie „persönlicher Assistent“ oder „digitaler Copilot“ fallen. Solche Agenten können horizontal skaliert werden, indem mehrere Agenten für unterschiedliche Ziele parallel laufen. Diese Skalierbarkeit macht AgentGPT als Prototyp für unternehmensähnliche Agentensysteme wie IBM watsonX Orchestrate attraktiv, bei denen robustere Leitplanken, Evaluation und Überwachung erforderlich sind.
Entwickeln, implementieren und verwalten Sie leistungsstarke KI-Assistenten und -Agenten, die Workflows und Prozesse mit generativer KI automatisieren.
Gestalten Sie die Zukunft Ihres Unternehmens mit KI-Lösungen, denen Sie vertrauen können.
Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.