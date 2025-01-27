DeepSeek-R1, das KI-Modell des chinesischen Startups DeepSeek, stieg wenige Stunden nach dem Start der KI-Open-Source-Plattform Hugging Face an die Spitze der Charts der meistgeladenen und aktivsten Modelle auf der KI-Open-Source-Plattform Hugging Face. Es löste auch Schockwellen an den Finanzmärkten aus, da es Investoren dazu veranlasste, die Bewertungen von Chipherstellern wie NVIDIA und die kolossalen Investitionen, die amerikanische KI-Giganten tätigen, um ihre KI-Geschäfte zu skalieren, neu zu überdenken.

Warum die ganze Aufregung? Ein sogenanntes „Reasoning-Modell“, DeepSeek-R1, ist ein digitaler Assistent, der bei bestimmten KI-Benchmarks für Mathematik- und Codierungsaufgaben genauso gut abschneidet wie OpenAIs o1, mit weitaus weniger Chips trainiert wurde und nach Angaben des Unternehmens etwa 96 % günstiger in der Anwendung ist.

„DeepSeek gestaltet die KI-Landschaft definitiv neu und fordert die Giganten mit Open-Source-Ambitionen und hochmodernen Innovationen heraus“, sagt Kaoutar El Maghraoui, Principal Research Scientist und Manager bei IBM AI Hardware.

Unterdessen hat ByteDance, der chinesische Tech-Riese, dem TikTok gehört, kürzlich seinen eigenen Logikalgorithmus UI-TARS angekündigt, der nach eigenen Angaben bei bestimmten Benchmarks OpenAIs GPT-4o, Anthropics Claude und Googles Gemini übertrifft. Der Agent von ByteDance kann grafische Oberflächen lesen, Schlussfolgerungen ziehen und eigenständig Schritt für Schritt handeln.

Von Start-ups bis hin zu etablierten Giganten scheinen chinesische KI-Unternehmen die Lücke zu ihren amerikanischen Konkurrenten zu schließen, vor allem dank ihrer Bereitschaft,Open Source zu erstellen oder den zugrunde liegenden Softwarecode mit anderen Unternehmen und Softwareentwicklern zu teilen. „DeepSeek ist es gelungen, einige ziemlich leistungsstarke Modelle in der Community zu verbreiten“, sagt Abraham Daniels, Senior Technical Product Manager für das Granite-Modell von IBM. DeepSeek-R1 wird auf Hugging Face unter einer MIT-Lizenz angeboten, die uneingeschränkte kommerzielle Nutzung erlaubt. „DeepSeek könnte die Demokratisierung der KI wirklich beschleunigen“, sagt er.

Letzten Sommer stellte das chinesische Unternehmen Kuaishou ein Video-Generierungstool vor, das wie OpenAIs Sora, aber von Anfang an der Öffentlichkeit zugänglich war. Sora wurde letzten Februar vorgestellt, aber erst im Dezember vollständig veröffentlicht, und selbst dann konnten nur Personen mit einem ChatGPT Pro-Abonnement auf alle Funktionen zugreifen. Die Entwickler von Hugging Face haben sich auch neue Open-Source-Modelle von den chinesischen Tech-Giganten Tencent und Alibaba geschnappt. Während Meta seine Llama-Modelle als Open Source veröffentlicht hat, verfolgen sowohl OpenAI als auch Google einen überwiegend geschlossenen Ansatz bei der Modellentwicklung.

Neben dem Vorteil von Open Source verwendeten die Ingenieure von DeepSeek auch nur einen Bruchteil der hochspezialisierten NVIDIA-Chips, die von ihren amerikanischen Konkurrenten zum Trainieren ihrer Systeme verwendet wurden. Die Ingenieure von DeepSeek gaben beispielsweise an, dass sie für das Schulen ihres DeepSeek-V3-Modells nur 2.000 GPUs (Grafikprozessoren) oder Chips benötigten, wie aus einer Forschungsarbeit hervorgeht, die sie zusammen mit der Veröffentlichung des Modells herausgaben.