Das Bestreben, menschenähnliche Denkmaschinen zu entwickeln – KI-Systeme, die logisch denken, sich anpassen und ein breites Spektrum an Herausforderungen bewältigen können – beherrscht die Schlagzeilen und prägt die technologischen Agenden neu. Doch Ruchir Puri, Chief Scientist bei IBM Research, strebt eine andere Art von Durchbruch an: KI, die sich ihren Lebensunterhalt verdient, indem sie jetzt nützlich ist, nicht durch ein hypothetisches Datum in der Zukunft.
Die Idee einer Maschine, die wie eine Person denkt, ist seit mehr als einem halben Jahrhundert Teil der Technologiekultur. In den letzten Jahren ist es von den Rändern der Informatikkonferenzen ins Zentrum der öffentlichen und politischen Diskussion gerückt. Künstliche allgemeine Intelligenz (AGI) ist zu einem Sammelbegriff für das Potenzial und die Gefahren moderner KI geworden.
„Jedes Mal, wenn wir einen Meilenstein erreichen, neigen wir dazu, diese Grenze weiter zu verschieben“, sagt Puri in einem Interview mit IBM Think über KI. „Wir dachten, sie wäre Schach. Dann dachten wir, sie wäre Sprache. Jetzt ist sie die Codierung oder Schlussfolgerung. Doch allgemeine Intelligenz bleibt undefiniert.“
Der Begriff „künstliche allgemeine Intelligenz“ gewann erstmals in den 2000er Jahren an Bedeutung, um zwischen engen KI-Systemen – solchen, die eine bestimmte Aufgabe sehr gut erfüllen – und der Art von breiter, anpassungsfähiger Intelligenz, die beim Menschen zu finden ist, zu unterscheiden. Jahrzehntelang blieb das Ziel ein Randthema, eher Gegenstand theoretischer Forschung und Science-Fiction als der klassischen Ingenieurwissenschaften.
Das begann sich mit dem Aufkommen des Deep Learning in den 2010er Jahren und dem Aufkommen von Foundation Models oder großflächigen neuronalen Netzen, die auf breit gefächerten Datensätzen trainiert wurden, zu verändern. Diese Modelle konnten zwar nicht im eigentlichen Sinne denken, aber sie waren in der Lage, überzeugende Texte zu generieren, Muster zu erkennen und Aufgaben zu erfüllen, die einst für Maschinen unerreichbar schienen.
Die letzten Jahre haben diese Entwicklungen beschleunigt. GPT-4, Claude 3, Gemini und andere Modelle können jetzt standardisierte Tests bestehen, Code schreiben, Forschung zusammenfassen und sogar Witze erklären. Sie sind immer noch spröde, geben oft falsche Antworten und haben kein wirkliches Verständnis. Aber sie verwischen die Grenze zwischen enger KI und etwas Flexiblerem – und für einige Forscher fühlt sich das wie AGI im Frühstadium an. Andere warnen davor, dass es sich immer noch um eine Illusion von Kompetenz handle und dass der Begriff „AGI“ eher rhetorisch als technisch sei.
Im einfachsten Sinne bezeichnet AGI eine Maschine, die jede intellektuelle Aufgabe ausführen kann, die auch ein Mensch ausführen kann – lernen, schlussfolgern, Probleme lösen – und zwar mit der gleichen Anpassungsfähigkeit und Generalisierungsfähigkeit. Im Gegensatz zu den derzeitigen KI-Systemen, die eng gefasst und hochspezialisiert sind, würde AGI flexibel in einem breiten Spektrum von Bereichen funktionieren, ohne für jeden einzelnen explizit programmiert werden zu müssen.
Im vergangenen Jahr hat eine Welle immer leistungsfähigerer Modelle die Erwartungen nur noch weiter verstärkt. OpenAI-CEO Sam Altman hat AGI als unmittelbar bevorstehend beschrieben. Seine öffentlichen Aussagen – und die strategische Ausrichtung des Unternehmens – deuten auf ein eindeutiges Engagement für die Entwicklung von Maschinen hin, die mit breiter Kompetenz rationalisieren können. Google DeepMind und Anthropic sind diesem Beispiel gefolgt und haben Systeme veröffentlicht, die für allgemeineres Denken, Speicher und Werkzeugnutzung optimiert sind.
Prominente Investoren und Forschung unterstützen die AGI-Vision, einige erklären sie für erreichbar innerhalb von fünf bis zehn Jahren. Politische Debatten sind ebenfalls in den Vordergrund getreten, da Gesetzgeber und Aufsichtsbehörden Bedenken über die Regulierung einer Technologie äußern, die per Definition keinen historischen Präzedenzfall hat. Für manche fühlt sich die Zukunft verlockend nah an; für andere gefährlich verfrüht.
Puris Antwort besteht nicht darin, den Ehrgeiz komplett abzulehnen, sondern die Frage neu zu formulieren: Was ist, wenn die eigentliche Grenze nicht darin besteht, eine Maschine zu bauen, die alles kann, sondern eine, die ein paar wesentliche Dinge gut kann?
Puri war maßgeblich am Bau der Systeme beteiligt, die IBM Watson und watsonx.ai Plattformen antrieben und Benchmarks für das setzten, was Maschinen leisten können. Heute ist er der Ansicht, dass das Fachgebiet ein neues Organisationsprinzip benötigt – etwas weniger Mythisches und etwas Praktischeres. Diese Idee, die Puri als „Artificial Useful Intelligence“ (AUI), also künstliche nützliche Intelligenz bezeichnet, beginnt zu beeinflussen, wie IBM und andere Forschungseinrichtungen ihre Forschung gestalten.
„Mir gefällt diese Perspektive zu ‚Lasst uns künstliche Intelligenz nützlich machen‘, denn wenn wir sie nützlich machen, wird niemand etwas dagegen haben“, sagt er.
Im Gegensatz zum Konzept von AGI, das eine Maschine impliziert, die die menschliche Intelligenz in allen Bereichen erreichen oder übertreffen kann, zielt AUI auf ein niedrigeres Ziel ab – bietet aber potenziell einen unmittelbareren Nutzen. Es geht nicht darum, etwas zu schaffen, das Sinfonien schreiben oder Philosophen ersetzen kann. Es geht darum, Tools zu entwickeln, die in klar definierten Kontexten zuverlässig funktionieren, wie Code-Copiloten, Compliance-Checker und Workflow-Optimierer.
Puri sprach mit mir aus seinem Büro im Thomas J. Watson-Forschungszentrum von IBM in Yorktown Heights, New York. Das Gebäude – ein weitläufiger, modernistischer Bau, eingebettet in die bewaldeten Hügel etwa eine Stunde nördlich von Manhattan – besitzt die stille Würde eines Ortes, an dem wissenschaftliche Entwicklungen im Verborgenen stattfinden. Die Besucher passieren blaue Namensschilder mit eingravierten mathematischen Formeln und Whiteboards mit halb aufgelösten Gleichungen. Entworfen vom modernistischen Architekten Eero Saarinen Anfang der 1960er Jahre, war das Labor Heimat einiger der berühmtesten Durchbrüche von IBM. Puri arbeitet hier seit Jahrzehnten.
Mit seinen langen Fluren und dem Blick auf den Wald ist es ein Ort, an dem langfristiges Denken nicht nur möglich, sondern geradezu erwartet erscheint – ein Umfeld, das hervorragend zu Puris Arbeitsweise passt. Seiner Darstellung nach ist sein Wechsel zu AUI weniger eine Kehrtwende als vielmehr eine Fortsetzung der Fragen, denen er sich seit Jahren widmet. Er hat sich seit Langem für Systeme interessiert, die in großem Maßstab einen praktischen Wert aufweisen, wie KI-Tools für die Softwareentwicklung, die er als „überraschend nützlich“ beschreibt – nicht nur für Experten, sondern auch für Anfänger, die Programmieren lernen. Diese breite Zugänglichkeit, so argumentiert er, spiegele das eigentliche Versprechen der KI wider.
Und wenn Modelle in reale Abläufe eingebettet werden, steht laut Puri viel auf dem Spiel. Im Bankwesen, im Transport und im Gesundheitswesen zum Beispiel können kleine Fehler schnell auftreten.
„Ich denke, die Öffentlichkeit hat durch all die beeindruckenden Demos einen falschen Eindruck bekommen“, so Puri. „ChatGPT, Midjourney, Sora – allesamt fantastisch. Aber in der Unternehmenswelt können Sie keine Zahl halluzinieren oder eine Vorschrift falsch verstehen. Es muss stimmen.“
Diese Sorge hat IBM dazu veranlasst, ein Hybridmodell einzuführen: Anstatt sich ausschließlich auf probabilistische Systeme zu verlassen, kombinieren sie Modelle mit verifizierten Werkzeugen wie Taschenrechnern, Such-APIs und strukturierten Datenvalidatoren, um Risiken zu minimieren. Diese Ansätze versprechen keine menschenähnliche Kognition – sie zielen auf Konsistenz ab. Ziel ist es, sicherzustellen, dass KI-Systeme in risikoreichen Umgebungen vertrauenswürdig sind, wo Genauigkeit und Nachvollziehbarkeit wichtiger sind als Kreativität oder Konversationsgeschick.
„Es gibt Anwendungsfälle, in denen Kreativität ein Vorteil ist“, sagt er, „und andere, in denen sie eine Schwäche ist.“
Puri verweist auf die Erfahrung von IBM in der Softwareentwicklung und Automatisierung als Beweis für das Konzept. „Es hat sich als überraschend nützlich erwiesen“, sagt er über KI. „Von Entwicklern, die sie in ihrem Alltag als hilfreich empfinden, bis hin zu Studenten, die Programmieren lernen und dabei Unterstützung von automatisierten Codierassistenten erhalten – sie ist nicht nur für Experten nützlich geworden, sondern für Menschen aus allen Gesellschaftsschichten.“
Er erinnerte sich an anfängliche Zweifel einiger Forscher, dass die Softwareentwicklung – die oft als eine äußerst kreative und komplexe Aufgabe angesehen wird – für Maschinen schwer zu bewältigen sein würde. „Man ging davon aus, dass es eine sehr, sehr schwierige Aufgabe sei“, sagt er. Dank LLMs wie ChatGPT und hauseigenen Spezialmodellen hat sich diese Annahme jedoch als falsch erwiesen. „Das war überraschend – nicht nur für mich, sondern für viele Menschen.“
Die weitreichendere Schlussfolgerung, so Puri, ist, dass, da „jedes Unternehmen heutzutage ein Softwareunternehmen ist“, der Nutzen von KI bei der Codierung eine breite Relevanz in verschiedenen Branchen zur Folge haben könnte.
Bei all dem Lärm um die KI – ihren Versprechen, ihren Fallstricken, ihrer Mythologie – kehrt Puri nach eigenen Angaben immer wieder zu einem ruhigeren Gedanken zurück: Vertrauen. Nicht nur im ethischen Sinne, sondern auch im mechanischen Sinne. Kann das System seine Versprechen halten? Ist es verlässlich, auch wenn niemand zuschaut?
Er bezieht sich auf die Verbreitung von Open-Source-Modellen – Metas Llama, Mistrals Mix-of-Experts-(MoE)-Systeme, IBMs eigene Granite-Linie – und den breiteren Wandel hin zu transparenter, kollaborativer Forschung. Diese Systeme sind nicht für Spektakel gebaut. Sie sollen getestet, abgestimmt und herausgefordert werden. Sie ermöglichen eine genaue Prüfung und laden zur Veränderung ein.
IBM beispielsweise preist seine Granite-Modelle nicht als Allzweckwunder an. Stattdessen handelt es sich bei den Modellen um Werkzeuge, die mit Blick auf Unternehmenskunden entwickelt und für die Bewältigung spezifischer Aufgaben im Finanzwesen, in der Logistik und anderen stark strukturierten Bereichen optimiert wurden. Puri betont ihren bewussten Fokus und gezielten Nutzen.
„Diese Modelle sind nicht dazu gedacht, Menschen zu ersetzen“, sagt er. „Sie sollen Menschen dabei helfen, mehr zu erreichen.“
Er betont auch, dass der eigentliche Test nicht die menschliche Intelligenz pauschal imitiert, sondern darin, ob KI Ergebnisse liefert, die für Menschen und Institutionen wichtig sind – und zwar konsistent, vorhersehbar und in großem Maßstab.
Mit Blick auf die Zukunft betrachtet Puri die Zukunft der KI als etwas, das weniger von Durchbrüchen von oben nach unten als vielmehr von umfassenden, iterativen Fortschritten geprägt sein wird, die von Zusammenarbeit, Experimenten und gemeinsamer Infrastruktur angetrieben werden.
Insbesondere glaubt er, dass die bedeutsamsten Fortschritte nicht aus versiegelten Laboren oder geheimen Demos kommen werden, sondern aus dem Aufbau von Gemeinschaften im Freien. Wie er es ausdrückt: „Dies ist eine der ersten Technologien, bei denen Innovation wirklich im Freien stattfindet.“
