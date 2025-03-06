Richard Sutton, einer der Pioniere der modernen künstlichen Intelligenz, ist nicht davon überzeugt, dass die bloße Steigerung der Rechenleistung von KI zu Maschinen verursachen wird, die wie Menschen denken. Er argumentiert sogar, dass die heutige Fokussierung auf die Skalierung des Deep Learning das volle Potenzial der KI möglicherweise einschränkt.
Sutton hat zusammen mit seinem langjährigen Kollegen Andrew Barto den diesjährigen Turing Award – oft als „Nobelpreis der Informatik“ bezeichnet – für seine Arbeit im Bereich des verstärkenden Lernens erhalten. Er ist der Ansicht, dass der eigentliche Durchbruch dann kommen wird, wenn KI nicht mehr auf kuratierte Datensätze angewiesen ist, sondern wie ein Kind aus Erfahrungen lernt.
„Wenn wir echte Intelligenz wollen, muss KI durch praktische Erfahrung, durch Versuch und Irrtum lernen“, erklärte Sutton in einem Interview. Rechenleistung sind kein Allheilmittel. Mehr Rechenleistung ist zwar hilfreich, aber nicht der zentrale Bestandteil von Intelligenz.“
Es ist eine gewagte Behauptung in einer Zeit, in der KI-Giganten wie OpenAI, Google DeepMind und Anthropic darum konkurrieren, ihre Modelle zu skalieren, indem sie sie mit immer größeren Datenmengen und Rechenleistung füttern, um ein menschliches Denkvermögen zu erreichen. Sutton ist jedoch der Ansicht, dass dieser Ansatz fehlerhaft ist, und argumentiert, dass echter Fortschritt nur durch die Verfeinerung der Algorithmen erzielt werden kann, die das Lernen der Maschinen steuern, und nicht nur durch deren Vergrößerung.
Suttons Beiträge zur KI reichen Jahrzehnte zurück. Dennoch liegt sein bedeutendster Einfluss im Bereich des verstärkenden Lernens. Diese Methode ermöglicht es der KI, durch Interaktion mit ihrer Umgebung zu lernen, ähnlich wie Menschen und Tiere durch Versuch und Irrtum lernen.
Das verstärkende Lernen funktioniert, indem ein KI-System für korrekte Handlungen belohnt und für Fehler bestraft wird, ähnlich wie ein Kind lernt, dass es nicht ratsam ist, einen heißen Herd zu berühren, aber gut ist, nach einem Spielzeug zu greifen. Im Laufe der Zeit verfeinert das KI-System seinen Entscheidungsprozess, indem es Belohnungen maximiert und Fehler minimiert.
Diese Technik wurde bekanntlich in AlphaGo verwendet, dem von Google DeepMind entwickelten KI-System, das 2016 die Welt beeindruckte, als es den Go-Weltmeister Lee Sedol besiegte. Die KI lernte nicht durch das Auswendiglernen menschlicher Strategien, sondern durch das Spielen von Millionen von Partien gegen sich selbst, wobei sie ihre Strategie durch verstärktes Lernen verfeinerte.
Seitdem hat sich das verstärkende Lernen über Spiele hinaus auf Bereiche wie Robotik, Finanzhandel und Gesundheitswesen ausgeweitet. Es unterstützt die Optimierung selbstfahrender Autos, die Verbesserung automatisierter Handelsalgorithmen und sogar die Feinabstimmung von KI-Chatbots wie ChatGPT durch verstärkendes Lernen aus menschlichem Feedback (RLHF). RLHF ermöglicht es KI-Modellen, ihre Antworten auf der Grundlage von Benutzerinteraktionen zu verfeinern, wodurch sie dialogorientierter werden und den Erwartungen der Menschen besser entsprechen.
Trotz dieser Fortschritte glaubt Sutton, dass das verstärkende Lernen noch nicht vollständig ausgeschöpft wird. „Es ist noch zu früh“, sagte er. „Heutige KI-Systeme basieren überwiegend auf vorverarbeiteten Daten und nicht auf realen Interaktionen. Das muss sich ändern, wenn wir eine KI anstreben, die wirklich versteht und sich anpasst.”
Die Idee der künstlichen allgemeinen Intelligenz (AGI) – KI, die wie ein Mensch denken, argumentieren und lernen kann – ist seit langem ein kontroverses Thema. Einige Experten sind der Ansicht, dass AGI noch viele Jahre entfernt ist, während andere glauben, dass es möglicherweise nie realisierbar sein wird. In einem anderen Lager behaupten einige Experten, dass AGI nicht das richtige Ziel sei, das Priorität haben sollte. „Wir sollten die Leistungsfähigkeit dieser Modelle in anderen Bereichen außerhalb der Sprachverarbeitung nicht außer Acht lassen“, erklärte Marina Danilevsky, leitende Wissenschaftlerin bei IBM, in einer Folge des Podcasts Mixture of Experts. „Wenn wir den Anwendungsbereich dieser Technologie tatsächlich erweitern, können wir uns auf Bereiche konzentrieren, die wesentlich interessanter, pragmatischer und praktischer sind, anstatt uns auf allgemeine künstliche Intelligenz zu fokussieren.“
Sutton nimmt eine zurückhaltende Haltung ein. Er schätzt die Wahrscheinlichkeit, dass KI innerhalb von fünf Jahren ein menschliches Intelligenzniveau erreichen könnte, auf 25 % und innerhalb von 15 Jahren auf 50 %. Das ist eine bemerkenswert optimistische Prognose im Vergleich zu vielen seiner Kollegen, die häufig davon ausgehen, dass es noch mehrere Jahrzehnte dauern wird, bis eine allgemeine künstliche Intelligenz erreicht ist.
„Es sind noch Durchbrüche erforderlich“, räumte er ein. „Aber wir kommen dem Ziel näher. Das größte fehlende Element ist die Frage, wie KI-Systeme auf natürlichere Weise aus Erfahrungen lernen können, anstatt mit gekennzeichneten Datensätzen gefüttert zu werden.”
Wie Sutton es beschreibt, besteht eine der größten Herausforderungen darin, KI beizubringen, langfristige Planung und Abstraktion zu verstehen – also die Fähigkeit, komplexe Probleme in kleinere, überschaubare Teile zu zerlegen, so wie es Menschen tun.
„Wenn ich Sie bitte, die Straße zu überqueren, denken Sie nicht über jede kleine Muskelbewegung nach. Sie denken über das Ziel nach: die Straße überqueren. KI muss auf diese Weise lernen, auf einer höheren Abstraktionsebene“, erklärte Sutton.
Einer seiner wichtigsten Beiträge zum verstärkenden Lernen ist das Konzept der zeitlichen Abstraktion, das es der KI ermöglicht, schrittweise zu lernen, anstatt sich in Mikromanagement zu verlieren. Dies könnte für KI-Systeme von entscheidender Bedeutung sein, die über lange Zeiträume hinweg Schlussfolgerungen ziehen müssen – etwas, womit die heutigen Modelle Stress haben.
Beispielsweise könnte ein KI-Assistent zwar gut in der Lage sein, eine Antwort auf eine einzelne Frage zu generieren, jedoch Stress haben, über mehrere Interaktionen hinweg ein logisches Gespräch aufrechtzuerhalten oder eine komplexe Aufgabe zu planen, die sich über einen längeren Zeitraum erstreckt – wie beispielsweise die Buchung eines Urlaubs, bei der Durchgänge, Hotels und Aktivitäten koordiniert werden müssen. Sutton ist der Ansicht, dass verstärktes Lernen und verbesserte Algorithmen für langfristiges Denken entscheidend sein werden, um diese Einschränkung zu überwinden.
Sutton glaubt, dass man sich die Zukunft der KI nicht als Tools oder Sklaven vorstellen sollte, sondern als Kinder – die lernen, sich weiterentwickeln und schließlich unabhängig werden.
„Wir behandeln unsere Kinder nicht als Maschinen, die kontrolliert werden müssen“, sagte er. „Wir begleiten sie, unterrichten sie, aber letztendlich entwickeln sie sich zu eigenständigen Persönlichkeiten. „Bei KI wird es nicht anders sein.“
Sutton warnt davor, KI als etwas zu betrachten, das beherrscht oder unterworfen werden muss, da dies zu feindseligen Beziehungen statt zu Zusammenarbeit verursachen könnte. Stattdessen argumentiert er, dass KI, genau wie Kinder die Werte der menschlichen Gesellschaft durch Beobachtung und Interaktion erlernen, gelehrt und nicht programmiert werden muss, um sich an menschlichen Werten auszurichten.
„Es geht hier nicht um Kontrolle, sondern um Verständnis“, erklärte er. „Wenn man ein Kind erzieht, sollte man nicht nur strenge Regeln aufstellen und Gehorsam erwarten. Sie zeigen Freundlichkeit, Fairness und Kooperationsbereitschaft, und das Kind verinnerlicht diese Werte. KI kann auf die gleiche Weise lernen.“
Diese Analogie wirft tiefgreifende Fragen auf. Wenn KI autonomer wird, wie wird die Gesellschaft diese digitalen Wesen integrieren? Werden sie Rechte haben? Sollte man ihnen Unabhängigkeit gewähren? Sutton schlägt vor, dass die Vorgehensweise bei der Entwicklung von KI heute darüber entscheidet, wie sich diese zukünftigen Beziehungen gestalten werden.
„Wenn wir KI in einem Umfeld des Vertrauens und der Zusammenarbeit entwickeln, wird sie lernen, mit uns zu koexistieren. Wenn wir sie als Feind betrachten, laufen wir Gefahr, Systeme zu schaffen, die allen Grund haben, sich uns zu widersetzen“, sagte er.
Suttons Perspektive stellt die herkömmlichen, auf Angst basierenden Narrative über die Ausrichtung künstlicher Intelligenz in Frage, die häufig davon ausgehen, dass fortgeschrittene KI eingeschränkt werden muss, um zu verhindern, dass sie der Menschheit Schaden zufügt. Stattdessen schlägt er einen Ansatz vor, der auf gegenseitigem Nutzen basiert, bei dem KI durch Erfahrung statt durch starre Beschränkungen lernt.
Suttons Vision für KI besteht letztendlich darin, Maschinen zu entwickeln, die wie Menschen lernen – durch Erkundung, Erfahrung und Anpassung. Für ihn liegt die Zukunft der KI nicht in größeren Modellen oder mehr Regeln, sondern darin, KI-Systeme zu entwickeln, die selbstständig Lösungen finden können.
Das Preisgeld des Turing Award – 500.000 US-Dollar von insgesamt 1 Million US-Dollar, die er sich mit Barto teilt – wird bereits für die Verwirklichung dieser Vision eingesetzt. Er hat das Openmind Research Institute gegründet, dessen Ziel es ist, jungen KI-Forschern die Freiheit zu geben, grundlegende Fragen zum Thema Lernen zu erforschen, ohne dem Druck der Kommerzialisierung ausgesetzt zu sein.
„Als Andy Barto und ich anfingen, hatten wir die Zeit und den Freiraum, Ideen frei zu erforschen“, erklärte er. Dies hat dazu geführt, dass das verstärkende Lernen zu dem geworden ist, was es heute ist. Ich möchte der nächsten Generation die gleiche Chance bieten.”
Ist KI auf menschlichem Niveau also unvermeidbar? Sutton bleibt vorsichtig optimistisch. „Es ist keine Frage des Ob, sondern des Wann“, erklärte er. „Und wenn das passiert, dann nicht, weil wir ein größeres Modell entwickelt haben. Es wird vielmehr daran liegen, dass wir ein intelligenteres Lernsystem entwickelt haben.“
Nehmen Sie an einem Webinar von IBM teil, in dem wir Ihnen anhand von Beispielen aus verschiedenen Branchen, Anwendungsfällen und sogar IBMs eigenen Erfolgsgeschichten zeigen, wie Sie durch agentische KI einen echten ROI erzielen können.
Erfahren Sie, warum IBM im Gartner Magic Quadrant™ for Data Science and Machine Learning Platforms 2025 als führend eingestuft wurde.
Erfahren Sie, wie Unternehmen von der KI-Einführung in verteilten Pilotprojekten zu ihrer Nutzung übergehen, um die Transformation im Kern voranzutreiben.
Greifen Sie auf unseren vollständigen Katalog mit über 100 Online-Kursen zu, indem Sie noch heute ein Abonnement für Einzel- oder Mehrbenutzer erwerben, mit dem Sie Ihre Fähigkeiten in einer Reihe unserer Produkte zu einem günstigen Preis erweitern können.
IBM Granite ist eine Familie offener, leistungsfähiger und vertrauenswürdiger KI-Modelle, die auf Unternehmen zugeschnitten und für die Skalierung Ihrer KI-Anwendungen optimiert sind. Entdecken Sie die Optionen zu Sprache, Code, Zeitreihen und Guardrails.
Das Programm, das von führenden IBM Experten geleitet wird, soll Führungskräften dabei helfen, das nötige Wissen zu erwerben, um die Prioritäten für KI-Investitionen zu setzen, die zu mehr Wachstum führen.
Wir haben 2.000 Unternehmen zu ihren KI-Initiativen befragt, um herauszufinden, was funktioniert, was nicht und wie Sie vorankommen können.
Nutzen Sie diese fünf Denkanstöße, um mit agentischer KI Unsicherheit zu durchbrechen, die geschäftliche Neuerfindung voranzutreiben und das Wachstum zu beflügeln.
Erfahren Sie, wie Sie generative KI und maschinelles Lernen sicher in Ihr Unternehmen integrieren können.
Erfahren Sie mehr über die drei entscheidenden Elemente einer starken KI-Strategie: die Schaffung eines Wettbewerbsvorteils, die Skalierung von KI im gesamten Unternehmen und die Förderung vertrauenswürdiger KI.
Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.
Setzen Sie KI in Ihrem Unternehmen ein
– mit branchenführendem Fachwissen im Bereich KI und dem umfassenden Lösungsportfolio von IBM an Ihrer Seite.
Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.
Profitieren Sie von einem einheitlichen Zugriff auf Funktionen, die den gesamten Lebenszyklus der KI-Entwicklung abdecken. Erstellen Sie leistungsstarke KI-Lösungen mit benutzerfreundlichen Oberflächen, Workflows und Zugriff auf branchenübliche APIs und SDKs.