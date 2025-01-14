Ein Supercomputer, der unter einen Schreibtisch passt, könnte verändern, wie Unternehmen mit künstlicher Intelligenz umgehen.
Auf der CES 2025 letzte Woche stellte NVIDIA Project DIGITS vor, einen persönlichen KI-Supercomputer mit dem neuen GB10 Grace Blackwell Superchip des Unternehmens. Das System, das ab 3.000 US-Dollar erhältlich ist und im Mai auf den Markt kommt, kann KI-Modelle mit bis zu 200 Milliarden Parametern ausführen und liefert eine KI-Rechenleistung von einem Petaflop.
„KI wird in jeder Anwendung und in jeder Branche zum Standard gehören“, erklärte Jensen Huang, Gründer und CEO von NVIDIA, in einer Pressemitteilung. „Mit dem Projekt DIGITS wird der Grace Blackwell Superchip Millionen von Entwicklern zugänglich gemacht.“ „Indem wir jedem Data Scientist, KI-Forscher und Studierenden einen KI-Supercomputer zur Verfügung stellen, befähigen wir sie, sich am Zeitalter der KI zu beteiligen und es mitzugestalten.“
Das Desktop-Gerät verfügt über 128 GB Unified Memory und bis zu 4 TB Speicherplatz und richtet sich an Unternehmen, die eine sofortige Datenverarbeitung ohne Cloud-Verzögerungen benötigen. Zwei Systeme können miteinander verbunden werden, um Modelle mit bis zu 405 Milliarden Parametern zu verarbeiten.
„Denken Sie an industrielle Anwendungen, bei denen Sie in der Fabrikhalle Rechenleistung direkt neben dem Ort der Fertigung benötigen“, erklärt Shobhit Varshney, Vice President bei IBM Consulting, in einer aktuellen Folge des Podcasts Mixture of Experts. „Es gibt eine Menge Latenz zwischen dem Aufrufen eines Servers oder einer Cloud-API und dem Erhalten von Antworten.“
Sicherheitskritische Vorgänge treiben die Nachfrage nach lokalen Verarbeitungsfunktionen an. Varshney beschrieb mehrere Szenarien, in denen dies unerlässlich ist. „Sie müssen sicherstellen, dass die Daten, insbesondere wenn sie sensible Informationen enthalten, Ihr Unternehmen nicht verlassen“, betont er. „Das Gleiche gilt für Verteidigungsanwendungen, bei denen man vor Ort eher taktisch vorgeht. Sie müssen in der Lage sein, alle Bilder, die von allen Drohnen an einem bestimmten Ort eingehen, zu verarbeiten, da Sie sich möglicherweise in einem Gebiet befinden, in dem Sie nicht einmal eine Serververbindung haben.“
Das Project DIGITS-System läuft auf dem Linux-basierten NVIDIA DGX OS, sodass Benutzer lokal entwickeln und dann in der Cloud oder in der Infrastruktur des Rechenzentrums bereitstellen können. „Fertigungsanlagen können durch Edge Computing ‚Echtzeitüberwachung, vorausschauende Wartung und Prozessoptimierung‘ implementieren“, erklärt Ashok Reddy., CEO des Softwareunternehmens KX. Finanzunternehmen erhalten Tools für „Echtzeithandel, Risikomanagement und prognostische Erkenntnisse in beispielloser Geschwindigkeit“. Unterdessen könnten Gesundheitsorganisationen die Technologie für „beschleunigte Diagnostik, Bildgebung und Arzneimittelentwicklung durch fortschrittliche KI-Analysen“ nutzen, so Reddy. Das System verarbeitet „riesige Mengen strukturierter und unstrukturierter Daten sofort“ für „Entscheidungen in Echtzeit und Analysen mit geringer Latenz“.
Der Ingenieurprofessor der University of Pennsylvania Benjamin Lee von der University of Pennsylvania sieht den Supercomputer von NVIDIA als Teil einer umfassenderen Entwicklung hin zu agentischer KI, bei der Systeme ganze Jobs statt einzelner Aufgaben verwalten.
„Eine intelligente KI entwickelt dann eine Strategie und bestimmt die Aufgaben, die für die Erledigung dieses Jobs erforderlich sind“, erklärt Lee und fügt hinzu, dass dieser Ansatz „die Produktivität erheblich verbessern könnte, da Menschen große Jobs von einem Agenten anfordern können, anstatt einzelne Aufgaben von einem Modell anzufordern.“
Varshney merkt an, dass die Open-Source-Technologie von NVIDIA aus der kürzlich erfolgten 700-Millionen-Dollar-Übernahme von Run KI stammt. „Sie versuchen sicherzustellen, dass sich die gesamte Branche in Richtung dieser physischen KI, agentischen KI und der autonomen Prozesse bewegt“, so Varshney. „Sie wollen das Rückgrat für jeden einzelnen dieser Bereiche sein.“
Die Preissenkungen wirkten sich auf alle Produktlinien aus. „Letztes Jahr kostete die 40er-Serie ihrer Chips 1.600 US-Dollar“, so Varshney. „Sie haben gerade einen gleichwertigen Chip für 550 US-Dollar auf den Markt gebracht.“
Die Preissenkungen deuten auf technische Fortschritte hin. „Das GPU-Design ist weitgehend festgelegt und wird nicht aggressiv auf Leistung, Energieverbrauch und Kosten optimiert“, erklärt Lee. Es ist jedoch möglich, dass NVIDIA diesen Punkt „viel früher als andere Chip-Entwickler erreicht hat, wodurch das Unternehmen sowohl in Bezug auf Leistung als auch Kosten wettbewerbsfähig ist“, so Lee.
„Modelle könnten für spezifische Aufgaben spezialisiert werden und dasselbe Ergebnis mit viel weniger Berechnungen und viel weniger Energieaufwand liefern“, sagt Lee. „Die Agenten könnten dann lernen, für jede Aufgabe das richtige spezialisierte Modell auszuwählen – etwas, womit ein Mensch möglicherweise Schwierigkeiten haben würde.“
Dieser Vorstoß in Richtung spezialisiertes Computing markiert eine dramatische Abkehr von den derzeitigen Einschränkungen. „Wir waren durch einige niedliche kleine Modelle eingeschränkt, die auf Mobilgeräten laufen“, erklärt Varshney. „Sie wollen Rechenleistung so leicht zugänglich und demokratisiert machen wie den Anschluss an das Stromnetz, aber sie wollen die elektrische Supermacht der ganzen Welt sein.“
