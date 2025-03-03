Das neue Claude 3.7 Sonnet von Anthropic kann jetzt seinen Deep-Thinking-Modus wie einen Lichtschalter ein- und ausschalten. Einfache Fragen werden sofort beantwortet, während die Rechenleistung für komplexe Probleme reserviert wird, die sie benötigen.
Dieser hybride Argumentationsansatz markiert einen Wandel in der künstlichen Intelligenz, von dem Experten sagen, dass er sowohl Kosten senken als auch Kapazitäten steigern kann, wobei die Granite-Modelle von IBM auch ähnliche Umschaltfunktionen verwenden, die auf der Komplexität der Aufgabe basieren. Diese Entwicklung kommt in einer Zeit, in der Unternehmen weltweit mit den finanziellen Realitäten fortgeschrittener KI zu kämpfen haben. Sie macht hochentwickeltes Denken leichter zugänglich und spart gleichzeitig wertvolle Computerressourcen.
„Die Kostenstruktur von Denkmodellen ist wichtig; nicht alle Fragen erfordern eine 32-sekündige Pause, damit das Modell es durchdenken kann“, sagt Maya Murad, Product Manager für KI bei IBM Research, in einer kürzlich erschienenen Folge des Podcasts Mixture of Experts . „Diese Funktion ermöglicht es Unternehmen, Ressourcen intelligent einzusetzen und umfangreiche Berechnungen nur dann durchzuführen, wenn das Problem dies erfordert, wodurch KI-Systeme entstehen, die besser der Herangehensweise des Menschen an verschiedene kognitive Aufgaben entsprechen.“
Hybrides Denken signalisiert eine Verlagerung des Schwerpunkts der KI-Branche von der einfachen Entwicklung leistungsfähigerer Systeme hin zur Entwicklung praktischer Systeme, sagt Abraham Daniels, Senior Program Manager bei IBM Research, gegenüber IBM Think. Für Unternehmen könnte diese Änderung von entscheidender Bedeutung sein, da die Kosten für den Betrieb hochentwickelter KI mittlerweile zu einem wichtigen Faktor geworden sind.
Modelle verbrauchen beim Deep Reasoning deutlich mehr Rechenressourcen – und kosten daher mehr Geld – als bei der Bereitstellung einfacher Antworten. Mit Hybrid Reasoning können Unternehmen ihre KI-Ausgaben optimieren, indem sie die Rechenleistung an die Komplexität der Aufgabe anpassen.
Anthropic hat vor Kurzem Claude 3.7 Sonnet mit einem „erweiterten Denkmodus“ auf den Markt gebracht, der es Benutzern ermöglicht, bei Bedarf gründlichere Analysen anzufordern. IBM stattete seine Granite-Modelle ebenfalls mit „Toggling“-Funktionen aus, die den Benutzern die Kontrolle darüber geben, wann sie das intensive Denken aktivieren sollen.
„Wir haben ein hybrides Denkmodell mit einer anderen Philosophie als andere Denkmodelle auf dem Markt entwickelt“, sagte ein Sprecher von Anthropic gegenüber IBM Think. „Unser Ansatz basiert auf der Funktionsweise des menschlichen Gehirns.“ Als Menschen haben wir nicht zwei getrennte Gehirne für schnelles versus tiefes Denken – und bei Anthropic betrachten wir das Schließen als etwas, das tief in die Fähigkeiten aller unserer Modelle integriert werden muss, statt als ein separates Merkmal. Dieser Ansatz basiert darauf, wie wir uns die Integration von Claude mit unseren Kunden über alle Anwendungen hinweg vorstellen. Während manche Interaktionen schnelle Reaktionen erfordern, wie beispielsweise das Brainstorming für Marketingmaterialien, erfordern andere, wie komplexe Finanzanalysen oder Branchenforschung, ein tieferes und längeres Nachdenken. Wir wollten beide Funktionen für unsere Kunden so einfach und kostengünstig wie möglich zugänglich und nutzbar machen.“
Mit diesem Ansatz wird der Denkprozess der KI transparenter. „Das Modell selbst ist immer noch eine Blackbox, aber zumindest an den Ausgaben kann man sehen, wie das Modell zu dieser Schlussfolgerung gekommen ist“, sagt Daniels. Diese Sichtbarkeit kann die Ergebnisse verbessern und Probleme der Erklärbarkeit adressieren, was besonders für regulierte Branchen wichtig ist, sagt er.
Daniels und andere Experten sehen in dieser Entwicklung die Erfüllung eines praktischen Bedürfnisses: die Beseitigung unnötigen Rechenaufwands bei einfachen Fragestellungen.
„Man braucht nicht für alle Aufgaben Unmengen an Begründungen, und es gibt einem die Möglichkeit, bei komplizierteren Dingen mehr zu bezahlen – sowohl in Bezug auf die Latenz als auch auf die Kosten“, sagt Kate Soule, Director of Technical Product Management bei IBM Research, im Podcast.
Das Innenleben großer Sprachmodelle (LLMs) war traditionell undurchsichtig. Ein Modell erhält einen Prompt und generiert eine Antwort, ohne seine internen Schlussfolgerungsschritte preiszugeben.
Hybrid Reasoning verändert diese Dynamik, indem es den schrittweisen Denkprozess eines Modells offenlegt. Wenn sie aktiviert werden, zeigen Systeme wie Granite 3.2 ihre Arbeit und machen die logischen Pfade, denen sie folgen, sichtbar.
„Unsere Entscheidung, Claudes Denkprozess sichtbar zu machen, spiegelt die Berücksichtigung mehrerer Faktoren wider. Zu diesen Faktoren gehören eine verbesserte Benutzererfahrung und die Vertrauenstransparenz in Claudes Argumentationsprozess“, sagte der Sprecher von Anthropic. „Dies gibt den Nutzern Erkenntnis in die Art und Weise, wie Schlussfolgerungen gezogen werden, und fördert so ein angemessenes Maß an Vertrauen und Verständnis. Die Benutzer vertrauen den Ausgaben im Allgemeinen mehr, wenn sie die Gedankenkette beobachten können. Wir hoffen, dass diese Transparenz es den Nutzern ermöglicht, die Qualität und Gründlichkeit von Claudes Argumentation besser zu beurteilen und ihnen hilft, Claudes Funktionen besser zu verstehen. Außerdem hoffen wir, dass Benutzer und Entwickler bessere Prompts erstellen können, indem sie Claudes Denkergebnisse lesen und gezieltes Feedback zu bestimmten Argumentationsschritten geben.“
„Die Möglichkeit, die eigentliche Denkweise des Modells offenzulegen, ist für die Erklärbarkeit von großem Vorteil“, sagt Daniels. „Bevor wir die Gedankenkette (Chain-of-Thought, CoT) demonstrieren konnten, ging es im Grunde nur um die Wahrscheinlichkeit des nächsten Tokens. Also ein bisschen eine Blackbox.“
Diese Technologien haben Anwendungen, die sich über viele Branchen erstrecken. „Finanz- und Rechtswesen passen ideal zusammen, da sie mit strukturierter Dokumentation arbeiten“, sagt Daniels und fügt hinzu, dass „jede regulierte Branche enorm von diesen fortschrittlichen Denkmodellen profitieren kann“.
Hybrides Denken kann jedoch besonders in Bereichen nützlich sein, die eine komplexe Analyse erfordern.
„Mathematik und Code sind die beiden Schwerpunkte, die ich als Benchmark für logisches Denken gesehen habe“, sagt Daniels. Für die Softwareentwicklung könnte der Nutzen erheblich sein: „Mithilfe eines Denkmodells lässt sich der Umfang des Projekts anhand der von Ihnen festgelegten Anforderungen genau definieren“, sagt er.
Standard-LLMs generieren Antworten, indem sie das wahrscheinlichste nächste Wort auf der Grundlage von Mustern in ihren Trainingsdaten vorhersagen. Dieser Ansatz funktioniert bei vielen Aufgaben gut, aber diese Modelle haben Probleme mit mehrstufigen Argumentationsproblemen.
Hybride Argumentationsmodelle können in einen rechenintensiven Modus wechseln und explizit logische Zwischenschritte generieren, bevor sie eine endgültige Antwort geben. Das Modell verwendet diese Schritte, um komplexe Probleme zu lösen, ähnlich wie Menschen Zwischenschritte beim Lösen komplexer mathematischer Probleme aufschreiben.
Die Architektur, die hybrides Schlussfolgern ermöglicht, baut auf dem auf, was Forscher als„Testzeit-Berechnung“ bezeichnen, bei dem Rechenressourcen während der Inferenz und nicht nur während des Trainings bereitgestellt werden.
„Traditionell wurde oft die gesamte Rechenleistung zum Trainieren des Modells verwendet, und die Inferenz des Modells war dann im Vergleich zu anderen Verfahren relativ ressourcenschonend“, sagt Daniels.
Doch mit zunehmender Komplexität der KI-Systeme wird die Herausforderung nicht nur in der Leistung liegen – sondern auch darin, zu wissen, wann man sie effizient einsetzen sollte. Deshalb wird die nächste Herausforderung für hybrides Denken, sagt Daniels, eine intelligentere Selbstregulierung sein: der KI beizubringen, wann sie ihren tieferen Denkmodus von selbst aktivieren muss, ohne dass Menschen ihr sagen, dass sie das tun soll.
„Der nächste Schritt in Bezug auf Argumentationsmodelle oder hybride Argumentationsmodelle besteht darin, wie wir Eingabe innerhalb der Testzeitberechnung oder innerhalb des Frameworks besser verstehen oder besser sortieren können“, sagt er.
