Forscher kategorisieren das Agentengedächtnis auf ähnliche Weise wie Psychologen das menschliche Gedächtnis kategorisieren. Der einflussreiche Artikel Cognitive Architectures for Language Agents (Coala)1 eines Teams der informierten Universität beschreibt verschiedene Arten von Gedächtnis als:
Kurzzeitgedächtnis
Das Kurzzeitgedächtnis (STM) ermöglicht es einem KI-Agenten, sich die letzten Eingaben zu merken, um sofortige Entscheidungsfindung zu ermöglichen. Diese Art von Speicher ist in der dialogorientierten KI nützlich, wo die Aufrechterhaltung des Kontexts über mehrere Austausche hinweg erforderlich ist.
Zum Beispiel kann ein Chatbot, der sich an frühere Nachrichten innerhalb einer Sitzung erinnert, kohärente Antworten liefern, anstatt jede Benutzereingabe isoliert zu behandeln, was die Benutzererfahrung verbessert. ChatGPT von OpenAI speichert beispielsweise den Chatverlauf innerhalb einer einzigen Sitzung und trägt so zu reibungsloseren und kontextsensitiveren Gesprächen bei.
STM wird in der Regel mithilfe eines rollierenden Puffers oder eines Kontextfensters implementiert, das eine begrenzte Menge aktueller Daten enthält, bevor es überschrieben wird. Dieser Ansatz verbessert zwar die Kontinuität bei kurzen Interaktionen, speichert aber keine Informationen über die Sitzung hinaus, was sie für eine langfristige Personalisierung oder das Lernen ungeeignet macht.
Langzeitgedächtnis
Das Langzeitgedächtnis (Long Term Memory, LTM) ermöglicht es KI-Agenten, Informationen über verschiedene Sitzungen hinweg zu speichern und abzurufen, wodurch diese im Laufe der Zeit immer persönlicher und intelligenter werden.
Im Gegensatz zum Kurzzeitgedächtnis ist LTM für die dauerhafte Speicherung konzipiert, die häufig mithilfe von Datenbanken, Wissensgrafen oder Vektoreinbettungen implementiert wird. Diese Art von Speicher ist entscheidend für KI-Anwendungen, die historisches Wissen erfordern, wie personalisierte Assistenten und Empfehlungssysteme.
So kann sich beispielsweise ein KI-gestützter Kundensupport an frühere Interaktionen mit einem Benutzer erinnern und die Antworten entsprechend anpassen, wodurch die Customer Experience insgesamt verbessert wird.
Eine der effektivsten Techniken zur Implementierung von LTM ist die Retrieval-Augmented Generation (RAG), bei der der Agent relevante Informationen aus einer gespeicherten Wissensdatenbank abruft, um seine Antworten zu verbessern.
Episodisches Gedächtnis
Das episodische Gedächtnis ermöglicht es KI-Agenten, sich an bestimmte vergangene Erfahrungen zu erinnern, ähnlich wie Menschen sich an einzelne Ereignisse erinnern. Diese Art von Gedächtnis ist nützlich für das fallbasierte Denken, bei dem eine KI aus vergangenen Ereignissen lernt, um in Zukunft bessere Entscheidungen zu treffen.
Das episodische Gedächtnis wird häufig durch die Protokollierung von Schlüsselereignissen, Aktionen und deren Ergebnissen in einem strukturierten Format implementiert, auf das der Agent bei seinen Entscheidungen zugreifen kann.
Ein KI-gestützter Finanzberater könnte sich beispielsweise an die früheren Anlageentscheidungen eines Benutzers erinnern und diese Entwicklung nutzen, um bessere Empfehlungen abzugeben. Dieser Speichertyp ist auch in Robotertechnik und autonomen Systemen unverzichtbar, wo sich ein Agent an vergangene Aktionen erinnern muss, um effizient zu navigieren.
Semantisches Gedächtnis
Das semantische Gedächtnis ist verantwortlich für das Speichern von strukturiertem Faktenwissen, das ein KI-Agent abrufen und für seine Argumentation verwenden kann. Im Gegensatz zum episodischen Gedächtnis, das sich mit bestimmten Ereignissen befasst, enthält das semantische Gedächtnis verallgemeinerte Informationen wie Fakten, Definitionen und Regeln.
KI-Agenten implementieren in der Regel das semantische Gedächtnis mithilfe von Wissensdatenbanken, symbolischer KI oder Vektoreinbettungen, sodass sie relevante Informationen effizient verarbeiten und abrufen können. Diese Art von Speicher wird in realen Anwendungen verwendet, die Fachwissen erfordern, wie z. B. juristische KI-Assistenten, medizinische Diagnosetools und Wissensmanagementsysteme in Unternehmen.
Ein KI-Rechtsassistent kann zum Beispiel seine Wissensdatenbank nutzen, um Präzedenzfälle abzurufen und genaue Rechtsberatung zu leisten.
Prozedurales Gedächtnis
Das prozedurale Gedächtnis von KI-Agenten bezeichnet die Fähigkeit, Fähigkeiten, Regeln und erlernte Verhaltensweisen zu speichern und abzurufen, die es einem Agenten ermöglichen, Aufgaben automatisch auszuführen, ohne jedes Mal eine explizite Begründung zu geben.
Sie ist vom menschlichen prozeduralen Gedächtnis inspiriert, das es Menschen ermöglicht, Aktionen wie Fahrradfahren oder Tippen auszuführen, ohne bewusst über jeden Schritt nachzudenken. In der KI hilft das prozedurale Gedächtnis den Agenten, ihre Effizienz zu verbessern, indem komplexe Aktionsabläufe auf der Grundlage früherer Erfahrungen automatisiert werden.
KI-Agenten lernen durch Training Abläufe von Aktionen, wobei sie häufig verstärkendes Lernen einsetzen, um die Leistung im Laufe der Zeit zu optimieren. Durch die Speicherung von aufgabenbezogenen Prozeduren können KI-Agenten die Rechenzeit verkürzen und schneller auf bestimmte Aufgaben reagieren, ohne die Daten von Grund auf neu zu speichern und zu verarbeiten.