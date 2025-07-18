Als DeepSeek-R1 am 20. Januar veröffentlicht wurde, elektrisierte das leistungsstarke, aber kosteneffiziente KI-Argumentationsmodell sowohl das Silicon Valley als auch die Wall Street. Aber warum ist das so? Es konnte ebenso gut argumentieren wie Topmodelle von Unternehmen wie OpenAI und Anthropic, verbrauchte aber Berichten zufolge deutlich weniger Rechenleistung und kostete nur einen Bruchteil so viel für Training und Nutzung. Allein im letzten Monat wurde das Modell mehr als 800.000 Mal auf Hugging Face heruntergeladen.
„Es war ein Weckruf“, erinnerte sich Larry Li, Gründer und geschäftsführender Gesellschafter der in Palo Alto ansässigen Investmentfirma AMINO Capital, in einem kürzlich geführten Interview mit IBM Think. Neue Technologien werden oft „rückwärts entwickelt“, sagte er. „Aber niemand hatte erwartet, dass es so gut gelingen würde.“
„Es hat lediglich das Narrativ geändert, dass die USA der einzige Ort auf der Welt sind, an dem Sie innovativ sein können“, sagte Matthieu Soulé, Leiter des C.Lab von Cathay Innovation, einem Fonds, der in KI-Innovationen in der gesamten EU und Asien, einschließlich China, investiert.
Viele sagten voraus, dass der Erfolg von DeepSeek die Branche und das globale KI-Rennen im Allgemeinen revolutionieren würde. Sechs Monate später wollten wir nachfragen und sehen: Hat das wirklich stattgefunden?
Wir sprachen mit einigen der gleichen Experten, die wir in den Stunden nach der Veröffentlichung von DeepSeek-R1 interviewt hatten, sowie mit mehreren anderen Experten, um ein ganzheitliches Bild zu bekommen.
In den Tagen nach der Veröffentlichung des DeepSeek-R1 äußerten viele Bedenken darüber, ob das Unternehmen die vollen Kosten genau erfasst und gemeldet hatte – nicht nur das Training des nahezu fertigen Modells – und welche Komponenten von welchen Firmen verwendet wurden. Mit anderen Worten: Hatten sie wirklich etwas Revolutionäres getan, oder war es eher ein schrittweiser Fortschritt?
Einige, wie IBM Principal Research Scientist Kaoutar El Maghraoui, sind der Ansicht, dass die eigentliche Innovation in dem liegt, was sie als „architektonische Effizienz“ bezeichnet, oder in der Kombination von Techniken wie „der Mischung von Experten, einer Strategie des Reinforcement Learning, Hardware-Software-Co-Design und verschiedenen anderen Optimierungstricks“. Es ist größtenteils eine clevere und effektive Umsetzung bereits bestehender Techniken", sagte sie in einem aktuellen IBM Think-Interview.
Dennoch sind sich Experten einig, dass DeepSeek-R1 die globale KI-Landschaft in einigen wichtigen Bereichen verändert hat. Zum einen gingen viele davon aus, dass die amerikanischen KI-Unternehmen einen „Burggraben“ oder Vorsprung hätten, der kaum aufzuholen sei. DeepSeek widerlegte diese Annahme, da es die Hürde für Entwickler und kleinere Unternehmen senkte, um Zugang zu den Tools zur Entwicklung ihrer eigenen LLMs zu erhalten.
„Entwickler und Anwender haben jetzt Zugriff auf die gleichen Funktionen wie bei o1 von OpenAI, und das zu einem Bruchteil der Kosten“, so Abraham Daniels, Senior Technical Product Manager bei IBM, in einem Interview.
Die Tatsache, dass DeepSeek seine Modelle als Open Source veröffentlicht hat, hat maßgeblich dazu beigetragen, die Zugänglichkeit zu erhöhen. „Wir haben seit DeepSeek und der Mitarbeit in der AI Alliance ein verstärktes Interesse an Open Source festgestellt“, sagte Anthony Annunziata, Director of AI Open Strategy bei IBM und der AI Alliance. Die AI Alliance ist ein internationales Netzwerk von Unternehmen und Organisationen, das daran arbeitet, offene und sichere KI zu schaffen, gegründet von IBM und Meta.
„In ganz Europa, in Vietnam, Indien und Japan gibt es all diese regionalen KI-Unternehmen, die sicherstellen wollen, dass sie die souveräne Kontrolle über ihre künstliche Intelligenz behalten – dass sie sie so gestalten können, wie sie es für ihre kulturellen, gesellschaftlichen und wirtschaftlichen Bedürfnisse wünschen, die sich von denen in den USA und anderen Ländern unterscheiden“, sagte Annunziata.
Der Schutz der heimischen KI-Forschung hat höchste Priorität. „Es gibt ein regelrechtes Bestreben nach digitaler Souveränität, bei dem Regierungen versuchen herauszufinden, wie sie ausländische KI-Einflüsse vermeiden können“, sagte El Maghroui.
Die Schaffung von LLM-Studiengängen auf der Grundlage lokaler Sprachen motiviert viele Unternehmer. „Die KI entwickelt sich in die Richtung, in der jedes Land oder jede Region als Nutznießer ihr eigenes Sprachmodell haben möchte, um zumindest ein Mitspracherecht bei der Beeinflussung des Verhaltens zu haben“, so Li.
Japan beispielsweise hat vor Kurzem den AI Promotion Act verabschiedet, um insbesondere die Förderung der Technologie zu unterstützen. Ende Juni hat die AI Alliance eine neue Niederlassung in Japan eröffnet, die sich auf zwei Bereiche konzentriert, die für lokale Unternehmer von großem Interesse sind: KI-Souveränität und KI in der Fertigung. Bei der Steuerung von KI-Systemen spielt die Sprache eine große Rolle. So haben sich beispielsweise Ende 2024 über 1.500 Forscher aus Wissenschaft und Industrie zusammengeschlossen, um leistungsstarke und offene japanische Sprachmodelle zu entwickeln .
Viele einheimische KI-Modelle und Unternehmer priorisieren auch lokale wirtschaftliche Interessen. Im Fall Japans entwickeln viele der Unternehmen, die der AI Alliance beigetreten sind, darunter Mitsubishi Electric und Panasonic, KI-Modelle, die auf die Fertigung und industrielle Anwendungen ausgerichtet sind – ein besonders großes Segment der japanischen Wirtschaft.
Andererseits wächst auch die Nachfrage nach lokalen Modellen, so Daisuke Okanohara, CTO und Mitbegründer von Preferred Networks, einem japanischen Hardware- und Softwareunternehmen, das fortschrittliche Software mit Deep Learning und KI entwickelt. Im Mai veröffentlichte Preferred Networks die zweite Version von PLaMo, ein kompaktes Modell, das lokal ausgeführt werden kann und in Japanisch und Englisch trainiert ist.
„Ihre Leistung ist insgesamt nicht so wettbewerbsfähig wie Frontier-Modelle, aber sie zeichnet sich durch bestimmte spezifische Aufgaben aus“, sagte Okanohara in einem Interview mit IBM Think. „In kleinen Anwendungsfall – wie etwa Modellen mit acht bis 30 Milliarden Parametern – übertrifft es CLANG, GPT-4o mini und ähnliche Modelle bei mehreren Aufgaben im Bereich der japanischen Sprache.“
Vietnam hat ebenfalls eine Welle unternehmerischer LLM-Aktivitäten erlebt und die AI Alliance hat dort im Juni dieses Jahres eine Niederlassung gegründet. Neben der Entwicklung eines vietnamesischen Sprachmodells konzentrieren sich die Unternehmer laut Annunziata darauf, mithilfe von KI-Modellen neue Arten von Chips zu entwickeln, die die KI antreiben sollen.
Ein weiterer Grund, warum DeepSeek so viele einheimische Unternehmer inspiriert hat, ist die Tatsache, dass verschiedene Länder die Verwendung von DeepSeek-R1 unter Berufung auf Sicherheits- und Datenschutzbedenken verboten oder eingeschränkt haben. Italien, Australien, Südkorea und Kanada haben DeepSeek verboten, und auch in mehreren US-Bundesstaaten wurde es eingeschränkt, insbesondere auf Regierungsseiten. Dies hatte den interessanten Nebeneffekt, dass lokale Unternehmer motiviert wurden, Open-Source-Tools zu nutzen, um sicherere Modelle zu entwickeln, die in ihrer jeweiligen Region eingesetzt werden können.
Das neueste Technologieunternehmen des Tech-Unternehmers und Risikokapitalgebers Kai-Fu Lee, 01.AI, will den B2B-Markt für KI-Lösungen für Unternehmen erkunden – ein Sektor, der in China bekanntermaßen schwierig ist, da die Hälfte der Unternehmen in Staatsbesitz ist und größere private Firmen bei ihrer Expansion unter Regierungseinfluss geraten können. Lee hat zuvor Rhymes KI gegründet, ein Unternehmen, das im vergangenen Herbst mehrere Produkte veröffentlicht hat, darunter eine Suchmaschine und Allegro, ein Open-Source-Video-Generierungsmodell.
„Wir betrachten die Sache pragmatisch: Die Modelle sind wirklich, wirklich gut genug. Allerdings ist die Nutzung für viele Unternehmen und Betriebe immer noch nicht einfach, und genau dieses Problem versuchen wir anzugehen“, so Anita Huang, Mitbegründerin von 01.KI, in einem Interview mit IBM Think. „Wir sind der Meinung, dass das fehlende Teil, insbesondere für den chinesischen Unternehmensmarkt, die Middleware-Schicht ist, die zu den Fenstern oder zum großen Sprachmodell wird.“ Derzeit verwendet die Unternehmensplattform Modelle wie DeepSeek und Qwen von Alibaba.
Unmittelbar nach DeepSeek sagten viele voraus, dass es den Weg für die Dominanz von Chain-of-Thought-Reasoning geebnet habe. Seitdem hat sich die Branche jedoch verändert. Neue Forschung hat gezeigt, dass Reasoning Models kosten- und ressourcenintensiv und für viele Aufgaben nicht notwendig sind, wenn man den Dienstprogramm dieser Modelle betrachtet.
Der größte Hype bestand wohl in der Übernahme von DeepSeek durch Unternehmen, angesichts der niedrigen Lizenzkosten (es wurde unter der freizügigen MIT-Lizenz lizenziert).
„In Wirklichkeit ist die Akzeptanz in Unternehmen nach wie vor sehr gering, vor allem aufgrund fehlender Datenschutzgarantien, mangelnder Compliance, unzureichender Governance und unzureichender Sicherheit“, sagte El Maghraoui.
Die meisten Unternehmen, zumindest in den USA, blieben bei Anbietern, die verwaltete oder auditierbare Lösungen anboten.
Annunziata sagte, es sei zwar gut, dass „die Menschen sehen, dass Innovationen aus unerwarteten Quellen kommen“, aber die gesamte KI-Branche und der breitere Markt hätten sich nicht so verändert, wie manche vorhergesagt hatten. Stattdessen „haben sich die Open-Source-Unternehmen verstärkt auf Open Source konzentriert, und die großen proprietären Anbieter konzentrieren sich darauf, Talente zu gewinnen, noch mehr darauf, Konkurrenten zu akquirieren oder Konkurrenten abzustumpfen, und sie stecken immer mehr Geld in ihre Modelle.“
Letztendlich könnte die größte Altlast von DeepSeek die Entwicklung kleiner, zweckmäßiger Modelle sein, so Daniels.
„DeepSeek hat das KI-Rennen eröffnet und kleinsprachige Modelle zum neuen Schlachtfeld gemacht“, sagte er. „Hochleistungsfähige, kleine Sprachmodelle könnten effizienter trainiert werden als größere Modelle und könnten Anwendungsfall in Unternehmen besser erfüllen.“
KI-Agenten – autonome KI-Systeme, die Aufgaben begründen, planen und ausführen können – haben 2025 in Unternehmen explosionsartig zugenommen und sind ein solcher Anwendungsfall. Kleinere Modelle eignen sich oft besser für agentische KI-Systeme, da sie effizienter sind, weniger Ressourcen benötigen und für bestimmte Aufgaben angepasst werden können.
IBM Distinguished Engineer Chris Hay hat es kürzlich in einer Folge von Mixture of Experts so ausgedrückt: „Wenn Sie Agenten einsetzen möchten, sollten Ihre Modelle klein, schnell und schlank sein.“
