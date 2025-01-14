Die Cosmos-Plattform umfasst Foundation Models, die physikbasierte Simulationen zum Training von KI-Systemen erzeugen können, sowie fortschrittliche tools, die laut NVIDIA 20 Millionen Stunden Video in nur zwei Wochen mit der Blackwell-Plattform verarbeiten und beschriften können – eine Aufgabe, die mit herkömmlicher CPU-Verarbeitung über drei Jahre dauern würde.

Während andere KI-Modelle Text oder Bilder generieren, konzentriert sich Cosmos auf physikbasierte Interaktionen in Industrie- und Fahrumgebungen. Entwickler können das System mit ihren Daten anpassen, beispielsweise mit Aufnahmen von Lagerrobotern oder autonomen Testfahrten. Die Plattform hat bereits Partner wie Uber auf sich aufmerksam, das sie als möglichen beschleunigenden Faktor auf dem Weg zu autonomen Fahrzeugen sieht.

NVIDIA veröffentlicht die Modelle unter einer offenen Lizenz über Plattformen wie Hugging Face. CEO Jensen Huang bezeichnet es als einen möglichen „ChatGPT-Moment“ für die Robotertechnik, indem er nahelegt, dass Foundation Models physische KI demokratisieren könnten, ähnlich wie große Sprachmodelle (LLMs) die Textgenerierung revolutionierten.

Armand Ruiz, VP of Product bei IBM Software mit Schwerpunkt auf KI-Plattformen, äußerte sich in einem LinkedIn-Beitrag zum Cosmos-Projekt und bezeichnete das Robotertrainingssystem als ein „technisches Meisterwerk“. Das Open-Source-System, das auf 20 Millionen Stunden realem Videomaterial trainiert wurde, stellt Nvidias Versuch dar, Foundation Models für robotische Bewegungen und Interaktionen zu schaffen.

„Das Beste daran ist, dass das Projekt Open Source ist!“, schrieb Ruiz und merkte an, dass Cosmos Szenarien wie das Umfallen von Kisten in Lagerhallen simulieren kann und es Unternehmen ermöglicht, das Training mit ihren eigenen Daten individuell anzupassen. Das System funktioniert mit der Isaac-Simulationsplattform von NVIDIA, obwohl seine reale Leistung noch getestet werden muss.

IBM-Forscher nutzten dieses Konzept in Wettervorhersagen durch ihr Prithvi-Climate-and-Weather Foundation Model. „Es hat die physikalische Dynamik globaler Prozesse des atmosphärischen Systems erlernt“, sagt Moreno. „Es könnte zur Generierung physikalisch korrekter Simulationen und multigranularer Forecasting-Aufgaben eingesetzt werden, ebenso wie für das Downscaling auf mehrere Auflösungsstufen.

Drei Unternehmen haben sich in diese Sandbox gewagt: Uber, der Roboterhersteller Figure AI, und der Entwickler autonomer Fahrzeuge Waabi haben Verträge zur Implementierung der Technologie unterzeichnet. Die Plattform verfügt über eine offene Modelllizenz zur individuellen Anpassung.