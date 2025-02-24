Der Chip-Wettlauf im Silicon Valley hat schon lange vor der Entwicklung von KI-Anwendungen begonnen, die den Appetit der Technologieunternehmen auf diese Chips erst so richtig angefacht haben. Im Jahr 2015 besiegte Googles KI-System AlphaGo, angetrieben von einem von Google entwickelten Chip namens Tensor-Processing Unit (TPU), einen professionellen menschlichen Spieler im alten chinesischen Spiel Go. Seitdem hat Google eine Reihe von Chips vorgestellt, die es selbst entwickelt hat, um KI-Systeme in seinem Rechenzentrum zu betreiben. Zuletzt kündigte Google im Dezember 2024 einen neuen KI-Chip für Quantencomputing namens Willow an. Das Unternehmen gibt an, dass Willow eine Standard-Benchmark-Berechnung in weniger als 5 Minuten durchführen kann – eine Berechnung, für die einer der heutigen schnellsten Supercomputer 10 Septillionen oder 1025 Jahre benötigen würde.

Ungefähr zur gleichen Zeit, als Google AlphaGo auf den Markt brachte, begannen Forscher bei IBM ebenfalls mit der Entwicklung von KI-Hardware. Bis 2021 hatte IBM sein AI Hardware Center in Albany, New York, eröffnet, um ein breiteres KI-Ökosystem zu schaffen, und bis 2022 hatte IBMs neuer Telum-Mikroprozessorchip KI-Inferenz auf IBM Z gebracht, die Mainframes, die wertmäßig etwa 70 % der weltweiten Transaktionen abwickeln. Ende 2024 kündigte IBM einen neuen Spyre-Beschleunigerchip an, der generative KI in IBM Z Mainframes für Unternehmensnutzer brachte.

Inzwischen arbeitet AWS seit mindestens 2018 an eigenen Computerchips für KI-Projekte. Auf der AWS-Jahresveranstaltung 2024 kündigte Amazon seinen neuesten maßgeschneiderten Trainium3-KI-Chip an, den das Unternehmen zusammen mit den großen Sprachmodellen des Partners Anthropic für Kunden bereitstellt. Viele Unternehmen haben sich die KI-Chips von AWS zugesichert, darunter Apple, das auf der AWS 2024 Aufmerksamkeit erregte, da Apple selten über einen seiner Anbieter sprach.

Microsoft, das seit Jahren Chips zur Steuerung seiner Gaming-Funktionen herstellt, kündigte 2023 eigene maßgeschneiderte KI-Chips an, etwa zur gleichen Zeit, als der Technologieriese Meta seine eigenen Siliziumchip-Pläne ankündigte. OpenAI ist das neueste Unternehmen, das sich der Custom-Silicon-Party anschließt, obwohl es noch keine offiziellen Ankündigungen gemacht hat. Obwohl keine Details öffentlich bekannt gegeben wurden, berichtete Reuters Anfang dieses Monats, dass OpenAI seine Chipdesigns finalisiert und plant, sie 2025 über TSMC herzustellen.

Warum hat sich das Chip-Wettrennen in letzter Zeit intensiviert? Varshney von IBM sagt, dass Unternehmen, wenn sie Chips an bestimmte Sprachmodelle für die benötigten Anwendungsfälle anpassen können, Kosten senken, die Latenz verbessern oder die Datenübertragung von einem Netzwerk in ein anderes beschleunigen können. Er nennt ein Beispiel: Historisch gesehen nutzten Unternehmen bei der Betrugserkennung und Prüfung eingehender Rechnungen klassische Rechentechniken, weil das Volumen hoch war und sie sehr schnelle Latenz benötigten. „Und das mussten sie eine Million Mal am Tag tun, sodass sich die Kosten sehr schnell summierten“, so Varshney.

Jetzt, da Unternehmen ihre Chips für bestimmte Modelle optimieren können, sinken die Kosten für großvolumige Anwendungsfälle und es wird kostengünstiger, diese Lösungen in der Produktion in großem Maßstab einzusetzen. „Aus Unternehmenssicht ändern sich die Anwendungsfall also nicht“, sagt Varshney. „Aber jetzt fangen wir an, nach den großvolumigen zu suchen, bei denen der ROI früher nicht existierte.“