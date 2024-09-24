Die neuesten o1-Preview-Modelle von OpenAI lösen komplexe Probleme, indem sie sie in Schritte unterteilen und so potenziell verändern, wie Branchen Herausforderungen angehen.
Dieser Ansatz, bekannt als Chain of Thought Reasoning, markiert eine bedeutende Abkehr gegenüber früheren KI-Modellen, die oft Antworten lieferten, ohne ihre Begründung zu erklären. Diese Fortschritte könnten die Herangehensweise an komplexe Problemlösungsaufgaben von Unternehmen und Forschern grundlegend verändern.
„Diese Modelle sind besser bei Aufgaben, die mehr Logik und Denkvermögen erfordern, weil sie Zeit haben, das Problem zu durchdenken“, sagte Chris Hay, Distinguished Engineer bei IBM. „Es ist, als würden sie ihre Arbeit Schritt für Schritt zeigen.“
Der Ansatz der Gedankenkette ermöglicht es den Nutzern, nachzuvollziehen, wie die KI zu ihren Schlussfolgerungen gelangt. Hay erklärte den Vorgang so: „Wenn man zum Beispiel ein Kind fragt: ‚Was ist 25 mal 10 plus 5?‘, dann sind das drei Schritte. Vielleicht geben sie einfach diese unklare Antwort. Aber Sie sagten, nein, nein, du musst das aufschlüsseln ... Es ist wie in der Schule, man zeigt seine Arbeit."
Nathalie Baracaldo, IBM KI Security Senior Research Scientist, betonte die Bedeutung dieser Entwicklung: „Der Hauptunterschied liegt darin, wie wir wissen können, wie das Modell zu einer Entscheidung kam. Wir haben Erklärungen darüber, was der Agent getan hat, die sehr nützlich sind, um zu verstehen, warum etwas passiert ist.“
Dieses Maß an Transparenz könnte weitreichende Auswirkungen auf verschiedene Branchen haben. In der Softwareentwicklung beispielsweise zeigen die Modelle verbesserte Codierung mit weniger Fehlern. Hay bemerkte: „Sie codieren besser und halluzinieren weniger“, und bezog sich dabei auf Fälle, in denen die KI plausible, aber falsche Informationen liefert.
Die neuen Modelle integrieren auch Reinforcement Learning in ihren Trainingsprozess. Hay erklärte: „Sie haben auch die Art und Weise geändert, wie sie in den Basismodellen trainiert werden.“ Sie sprechen darüber, wie sie Reinforcement Learning einsetzen, um diese Modelle zu trainieren.“
Die effektivste Nutzung dieser fortschrittlichen KI-Modelle wird wahrscheinlich eine Partnerschaft zwischen menschlichem Fachwissen und maschinellen Funktionen erfordern. „Der Mensch muss immer Input geben, mit der Planung einverstanden sein und diese Dinge Verify“, sagte Hay.
Hay warnte davor, die Leistungsfähigkeit der Modelle zu überschätzen: „Ich denke, man kann großartige Ergebnisse erzielen. Ich denke, wenn die Leute das Wort AGI hören, denken sie an diesen großen pulsierenden Kopf in der Cloud ... tatsächlich, wenn ich darüber nachdenke, machen die Modelle, wie sie sind, mit ihrer nächsten Tokenvorhersage, guten Trainingsdaten und ihrer Planung usw. einen ziemlich guten Job – besser als Menschen in vielen Aufgaben.“
Die Entwicklung dieser Modelle wirft Fragen zur Natur der künstlichen Intelligenz und deren Vergleich mit menschlicher Kognition auf. Die neuen Modelle haben in bestimmten Bereichen bemerkenswerte Fähigkeiten bewiesen – sie übertreffen den Menschen bei standardisierten Tests wie der Anwaltsprüfung und dem Studierfähigkeitstest in den USA, SAT. Dennoch kämpfen sie immer noch mit Aufgaben, die für die meisten Menschen intuitiv sind.
Hay wies darauf hin, dass die Modelle mit Aufgaben, die Menschen als einfach empfinden, Schwierigkeiten haben können: „Das Modell ist hervorragend bei spezifischen Einzelaufgaben. Allerdings hat es derzeit Schwierigkeiten, zwischen verschiedenen Teilen eines Gesprächs zu unterscheiden. Dies führt zu Verwirrung hinsichtlich der Fähigkeit des Systems, mehrere Konzepte gleichzeitig zu verarbeiten. Das Modell legt zu viel Wert auf den Kontext und berücksichtigt bei der Bearbeitung von Anfragen oft zu viele irrelevante Informationen.“
Baracaldo fügte eine Warnung hinzu: „Auch wenn dieses Modell sehr beeindruckend ist, macht es manchmal Fehler. Und wenn Sie den technischen Bericht lesen, sehen Sie, dass manchmal Lösungen entstehen, die ein echter Experte, ein Mensch, denkt, dass sie nicht machbar sind, aber das Modell kennt nicht alle Annahmen.”
Die Auswirkungen dieser Fortschritte reichen weit über die Technologiebranche hinaus. In Forschung und Wissenschaft könnten sie das Entdeckungstempo beschleunigen, indem sie komplexe Datenanalysen und Hypothesengenerierung unterstützen. In Bereichen wie Medizin und Recht könnten sie als Instrumente zur Erweiterung des menschlichen Fachwissens dienen und potenziell zu genaueren Diagnosen oder umfassenderen Rechtsanalysen führen.
Hay fasste den praktischen Wert der neuen Modelle für Unternehmen zusammen: „Sie sind viel bessere Programmierer als zuvor.“