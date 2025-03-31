Da Argumentationsmodelle wie OpenAIs o1, DeepSeek-R1 und Googles Gemini 2.5 um die besten KI-Intelligence-Benchmarks konkurrieren, werden Unternehmen, die KI integrieren wollen, zunehmend misstrauisch gegenüber dem Phänomen, das als „Model Bloat“ bezeichnet wird – dem Phänomen, bei dem Modelle unnötig groß oder komplex werden, was die Rechenkosten und die Trainingszeit der Modelle in die Höhe treibt und die Geschwindigkeit verringert, mit der sie die Antworten liefern können, die Unternehmen benötigen.

OpenAIs o1 und DeepSeek-R1 nutzen die Chain-of-Thought-(CoT-)Logik, um komplexe Probleme in Stufen aufzuteilen und so eine beispiellose Leistung sowie eine größere Genauigkeit als frühere Modelle zu erzielen. Aber CoT erfordert auch erhebliche Rechenressourcen während der Inferenz, was zu langen Ausgaben und höherer Latenzzeit führt, sagt Volkmar Uhlig, ein VP und KI-Infrastruktur-Portfolio-Lead bei IBM, in einem Interview mit IBM Think.

Hier kommt eine neue Klasse von Prompting-Techniken ins Spiel, die in verschiedenen neuen Veröffentlichungen beschrieben werden. Sie reichen von Atom of Thought(AoT) bis hin zu Chain of Draft(CoD) und sollen die Effizienz und Genauigkeit von CoT erhöhen, indem sie den Modellen helfen, Probleme schneller zu lösen und so Kosten und Latenzzeiten zu reduzieren.

Der KI-Wissenschaftler und Startup-Gründer Lance Elliott sieht die neuen Abzweigungen der Denkkette als Variationen im Toolkit eines Prompt Engineers. „In Ihrem typischen Toolkit für Heimwerkerarbeiten gibt es vielleicht einen normalen Hammer – das wäre CoT“, sagt er zu IBM Think. „AoT wäre vergleichbar mit der Verwendung eines Spezialhammers, der für Situationen wie das Schneiden und Anpassen von Gipskartonplatten eingesetzt wird.“ Man könnte zwar einen normalen Hammer für Gipskartonarbeiten verwenden, aber es wäre ratsam, einen Gipskartonhammer zu benutzen, wenn man einen besitzt und weiß, wie man ihn richtig einsetzt.“

Vyoma Gajjar, AI Technical Solution Architect bei IBM, sieht Potenzial in diesen neuen CoT-Verwandten, insbesondere für Unternehmen „die nach kosteneffizienteren Wegen suchen, um kleine Modelle dazu zu bringen, genaue Antworten für ihre spezifischen Anwendungsfälle zu erhalten“, sagt sie.