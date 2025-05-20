Wenn Sie wissen, wie große Sprachmodelle funktionieren, können Sie verstehen, warum sie manchmal Fehler machen. LLMs sagen das nächste Wort in einem Satz anhand von Mustern voraus, die sie aus großen Textmengen gelernt haben. Sie ziehen keine Fakten aus einer Datenbank, sondern stellen fundierte Vermutungen an. Das kann zu Antworten führen, die korrekt klingen, aber falsch sind, vor allem, wenn das Thema unklar oder ungewöhnlich ist oder über das hinausgeht, worin das Modell trainiert wurde.

Halluzinationen sind schwer zu beseitigen, weil sie keine Fehler im System darstellen, sondern ein eigenes Merkmal der Funktionsweise dieser probabilistischen Modelle. Wenn kein festes Muster in den Trainingsdaten vorhanden ist oder wenn ein Prompt zu vage oder offen ist, kann das Modell etwas erfinden, das plausibel klingt.

Hier spielt auch eine eher philosophische Frage eine Rolle. Wenn ein KI-Modell etwas erfindet, scheitert es dann oder erschafft es etwas Neues?

Puri stellt fest, dass Modelle, die in ihrer Argumentation effektiver werden, mitunter ein „kreativeres“ Verhalten zeigen, das an Halluzination grenzt. „Man könnte argumentieren, dass Kreativität eine Art Halluzination beinhaltet“, sagt er. „Man stellt sich das Unvorstellbare vor. Bei Anwendungen ist das jedoch ein Nachteil, keine Stärke.“

Der IBM Forscher Payel Das gehört zu denjenigen, die versuchen, das Problem zu lösen, indem sie überdenken, wie Modelle mit Informationen umgehen. „Das ist das Paradoxon des Fortschritts“, sagt Das in einem Interview IBM Think. „Diese Modelle werden immer besser im logischen Denken, aber nicht unbedingt im Erinnern. Sie können schwierigere Probleme lösen, verstehen die Grundlagen aber trotzdem falsch.“

Ihr Team bei IBM entwickelt Larimar, ein Gedächtniserweiterungssystem, das Modellen eine Form von editierbarem, kurzfristigem Gedächtnis verleiht. Die Idee ist, dass Modelle Fakten bei Bedarf überarbeiten oder vergessen können, ohne das gesamte System neu zu trainieren – eine Echtzeit-Flexibilität, die den aktuellen LLMs weitgehend fehlt.

„Die heutigen Modelle sind statisch und anfällig“, sagt sie. „Man kann ihnen nicht mitten im Gespräch etwas beibringen oder ihr Verständnis aktualisieren, ohne sie komplett neu zu trainieren. Larimar ist ein Schritt hin zu mehr Flexibilität.“

Auch andere gedächtnisbasierte Ansätze zeigen vielversprechende Ergebnisse. MemReasoner, das von Microsoft-Forschern entwickelt wurde, hilft Modellen, über lange Sequenzen hinweg effektiver zu denken, indem es relevante Informationen aus früheren Teilen eines Gesprächs auswählt und miteinander verbindet. IBMs eigenes CAMELoT-Projekt ist darauf ausgelegt, Modellen zu helfen, bei der Arbeit mit großen Textmengen oder erweiterten Interaktionen kohärent zu bleiben.

Außerhalb des Labors entwickeln Unternehmen wie Vectara praktische Tools, um Halluzinationen zu bekämpfen. Die „Guardian Agents“ von Vectara überwachen KI-Outputs in Echtzeit und schreiben Fehler um, bevor sie den Benutzer erreichen. Das ist der Meinung, dass es zwar keine einzelne Lösung für das Problem gibt, die Kombination von Gedächtnis- und Revisionsstrategien aber ein wichtiger Schritt nach vorn sei.

„Wir werden nie jeden Fehler ausmerzen können“, erklärt Das. „Genauso wie Menschen Fehler machen. Aber wir können Modelle entwickeln, die besser lernen, sich anpassen und selbst korrigieren. Und das macht einen enormen Unterschied.“