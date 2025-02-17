Ihre Hauskatze ist womöglich schlauer als ChatGPT. Künstliche Intelligenz kann zwar inzwischen Gedichte schreiben und Jura-Prüfungen bestehen, aber sie kann immer noch nicht mit den grundlegenden Denkfähigkeiten mithalten, die es Ihrer Katze ermöglichen, sich auf Fenstersimsen zurechtzufinden und auf Beute zu stürzen.
Diese Kluft – zwischen der Beherrschung menschlichen Wissens durch KI und ihrer Unfähigkeit, das Verständnis eines Tieres von der physischen Welt zu erreichen – hat sich als entscheidende Herausforderung auf der Suche nach intelligenteren Maschinen herausgestellt. Der leitende KI-Wissenschaftler von Meta, YannLeCun, rückte das Thema letzte Woche auf einem Pariser KI-Sicherheitsgipfel ins Rampenlicht und argumentierte, dass „Weltmodelle“ – KI-Systeme, die interne Repräsentationen von Struktur, Dynamik und kausalen Beziehungen bilden – der Schlüssel zum Fortschritt der künstlichen Intelligenz sein könnten.
Allerdings bezweifeln einige führende Forscher, ob dieser Ansatz tatsächlich so bahnbrechend ist, wie er scheinen mag.
„KI verwendet seit den 1950er Jahren Weltmodelle, und mehrere Teilbereiche der KI hängen vollständig von Weltmodellen ab“, so Stuart J. Russell, Professor für Informatik an der University of California Berkeley, im Gespräch mit IBM Think. „Das ist ungefähr so neuartig und genial, wie die Idee, dass Mathematik für die Physik nützlich sein könnte.“
Die Debatte beleuchtet ein intensiveres Streben nach künstlicher allgemeiner Intelligenz (AGI) oder KI-Systemen, die das menschliche Lernen und Denken in praktisch jedem Bereich erreichen oder übertreffen können. Im Gegensatz zu den heutigen spezialisierten KI-Systemen, die sich bei eng begrenzten Aufgaben wie Schach oder Sprachverarbeitung auszeichnen, müsste AGI die Welt fundamentaler verstehen und dabei Denkvermögen, physikalisches Verständnis und Anpassungsfähigkeit kombinieren.
Die großen Technologieunternehmen haben unterschiedliche Ansätze zur Bewältigung dieser Herausforderung gewählt. OpenAI hat sich durch seine GPT-Serie darauf konzentriert, Sprachmodelle zu skalieren, um immer ausgefeiltere Argumentation zu erreichen. Google DeepMind hat mit Systemen wie AlphaFold und AlphaGo gezielt aufbestimmte Domänen gezielt und gleichzeitig auf allgemeinere Funktionen hingearbeitet. Meta hingegen hat die Bedeutung dessen betont, aus realen Interaktionen zu lernen und nicht nur aus Text.
„Vergessen Sie die Idee, menschliche Intelligenz nachzubilden“, sagte LeCun auf dem Gipfeltreffen. „Wir können nicht einmal Katzen- oder Rattenintelligenz reproduzieren. Jede Hauskatze kann äußerst komplexe Aktionen planen.“
In den letzten Jahren haben KI-Systeme ihre Ergebnisse bei Benchmarks in bestimmten Bereichen rasant erhöht. Aber LeCun verweist auf das, was Forscher das Moravec-Paradoxon nennen: die Beobachtung, dass die Fähigkeiten, die Menschen leicht fallen, für Maschinen oft am schwersten zu meistern sind.
„Dinge, die wir für selbstverständlich halten, weil Menschen und Tiere sie tun können, denken wir, sie seien nicht kompliziert – in Wirklichkeit sind sie sehr kompliziert“, sagte LeCun. „Und die Dinge, von denen wir denken, dass sie einzigartig menschlich sind, wie das Manipulieren und Generieren von Sprache, Schach spielen, Go spielen … stellen sich als relativ einfach heraus.“
Dieses Paradoxon – dass KI bei Aufgaben, die wir als intellektuell anspruchsvoll betrachten, hervorragende Leistungen erbringt, während sie mit scheinbar grundlegenden physikalischen und Wahrnehmungsfähigkeiten zu kämpfen hat – ruft bei einigen Experten Skepsis hervor.
„Der Prozess, von einer Abfolge von Netzhautbildern zu beispielsweise Maxwells Gleichungen für den Elektromagnetismus zu gelangen, dauerte für die Menschheit Zehntausende von Jahren und erforderte einen kumulativen Prozess der Begriffsbildung und Mathematisierung“, sagt Russell. „Ich habe in den aktuellen Deep-Learning-Systemen nichts Vergleichbares gesehen.“
Um die derzeitigen Einschränkungen zu verdeutlichen, wies LeCun auf einen eindrucksvollen Vergleich hin: Moderne LLMs trainieren auf Billionen von Tokens – eine Textmenge, für die ein Mensch eine halbe Million Jahre bräuchte, um sie zu lesen. Ein vierjähriges Kind hingegen, das nur etwa 16.000 Stunden am Tag wach ist, verarbeitet eine vergleichbare Datenmenge allein durch visuelle Wahrnehmung.
„Ein vierjähriges Kind hat in Form von visueller Wahrnehmung genauso viele Daten gesehen wie das größte LLM, und für blinde Kinder ist es der Tastsinn“, sagte LeCun. „Das sagt einiges aus. Wir werden niemals eine menschliche Intelligenz erreichen, indem wir nur mit Texten trainieren.“
Diese Beobachtung hat die Forscher dazu veranlasst, neue Ansätze zu erkunden. Bei Meta hat sich LeCuns Team sogar ganz vom Begriff „künstliche allgemeine Intelligenz“ verabschiedet und bevorzugt stattdessen „fortschrittliche maschinelle Intelligenz“ (Advanced Machine Intelligence oder AMI). „Der Grund dafür ist, dass die menschliche Intelligenz tatsächlich recht spezialisiert ist, weshalb die Bezeichnung AGI eigentlich irreführend ist“, erklärt LeCun.
LeCun ist der Ansicht, dass wir die Entwicklung der KI grundlegend überdenken müssen. Anstatt zu versuchen, das menschliche Gehirn zu kopieren, möchte er ändern, wie KI über die Welt lernt und ihr einen Sinn gibt. Er argumentiert, dass sich die KI ihr eigenes Bild von der Realität machen muss, indem sie Informationen über ihre „Sinne“ aufnimmt, zum Beispiel durch das Anschauen von Videos lernt, wie sich physische Objekte verhalten. Diese KI-Systeme müssten sich Dinge konsistent merken und wissen, wie sie ihre Aktionen Schritt für Schritt planen müssen, um Dinge zu erledigen.
Informatiker sind sich uneins darüber, wie KI-Systeme ihr eigenes Verständnis der Welt entwickeln können. Der emeritierte Professor der University of Washington, Pedro Domingos, sieht Fortschritt als möglich, aber nicht sofort. „Es ist durchaus realistisch, KIs zu entwickeln, die ihre eigenen Weltmodelle erstellen“, sagte er gegenüber IBM Denken, „aber wir wissen noch nicht wie, und weitere Forschung ist nötig.“
Die derzeitigen KI-Funktionen reichen nicht an das menschliche Denkvermögen heran, insbesondere bei der Bewältigung komplexer Aufgaben. Russell formuliert es so: „Seit den 1960er Jahren haben wir verstanden, dass die Verwendung einfacher, einheitlicher Weltmodelle zu völlig unlösbaren Denk- und Planungsproblemen führt.“ (Stellen Sie sich vor, Sie müssten einen Urlaub planen und im Voraus die genaue Abfolge von 800 Millionen Aktivierungen berechnen, die dafür nötig sind.) Der Mensch verarbeitet Informationen anders, so stellt er fest: „Das wichtigste Werkzeug, das der Mensch benutzt, um dies zu überwinden, ist die Hierarchie – wir arbeiten mit vielen Modellen auf vielen Abstraktionsebenen, von großen, übergeordneten Aktionen bis hin zu winzigen, untergeordneten Aktionen, wie zum Beispiel dem Bewegen eines Fingers, um das nächste „i“ in dieser E-Mail zu tippen.“
