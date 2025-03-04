Wer am 20. Januar 2025 die Schlagzeilen las, hätte meinen können, der Himmel falle ihm auf den Kopf. Das liegt daran, dass das in China ansässige Unternehmen DeepSeek sein R1 Large Language Model (LLM) veröffentlichte, das kurz nach seiner Veröffentlichung schnell zu einem der am häufigsten heruntergeladenen und aktivsten Modelle wurde.

Was die Aufregung auslöste, war die Tatsache, dass das in Hangzhou, China, ansässige KI-Forschungslabor, das Modelle unter seinem Namen herausbringt, ein Modell zu weitaus geringeren Kosten – 5,6 Mio. USD – und mit weit weniger Ressourcen und Zugang zu NVIDIA-Chips als die führenden US-Modelle gebaut hat.

Wie erwartet, äußerten viele Menschen offen ihre Besorgnis darüber, dass einige der hochfinanzierten US-amerikanischen KI-Firmen ins Hintertreffen geraten könnten. Da DeepSeek weniger NVIDIA-Chips verwendete als diese anderen Firmen, sank der Aktienkurs des Unternehmens. Das war jedoch eher eine spontane Reaktion auf die Nachricht als etwas, das dem Unternehmen wirklich Sorgen bereitete und die Zukunft des Chipherstellers gefährdete.

Technologie- und Wirtschaftsreporter betrachteten diese Nachricht als Schock für das System. Für andere KI-Experten und mich war die einzige Überraschung bei der Ankündigung von DeepSeek R1 jedoch, wie überrascht alle zu sein schienen.

Obwohl das Modell neu war, ist DeepSeek alles andere als ein neuer Anbieter auf dem Markt. Das Unternehmen hat in der Vergangenheit viele wertvolle Open-Source-Modelle für den chinesischen Markt produziert, insbesondere das im Dezember veröffentlichte Modell V3. Es hat sogar ein begleitendes technisches Dokument veröffentlicht, das allen, die sich mit dem Aufbau dieser Labore befassen möchten, eine Bildung bietet. Das V3-Modell war eher eine Überraschung, aber das blieb offenbar unter dem Radar.

Das R1-Modell von DeepSeek ist natürlich ein weiteres Beispiel für ein generatives KI-Tool, das die Grundlage für die agentische KI-Zukunft werden kann, in der KI-Tools nicht nur auf die Anfragen ihrer Nutzer reagieren, sondern auch eigenständig Dienstleistungen bereitstellen.

IBM arbeitet mit all diesen Modellen zusammen und nutzt sie, aber wir sind auch große Befürworter und Entwickler der Open-Source-Bewegung. Dass ein Open-Source-Modell wie R1 das verdiente Lob erhält, ist großartig für die Branche.

Es ist verständlich, dass es für die großen Akteure etwas erschütternd war, zu sehen, wie DeepSeek ein Modell produziert, das ihren Modellen ebenbürtig oder besser ist als sie, aber für einen Bruchteil der Kosten bekannterer Modelle gebaut wurde. Genau dafür ist die Open-Source-Community jedoch konzipiert.

Die Ankündigung von DeepSeek R1 verdeutlicht das Aufeinandertreffen zweier Welten: Die Finanzmärkte prognostizierten Turbulenzen, während KI-Experten von dem technologischen Durchbruch begeistert waren und davon, wie er die Entwicklung effizienterer und leistungsfähigerer neuerer Modelle ermöglichen könnte.