Open-Source-Modelle von OpenAI auf IBM watsonx.ai verfügbar

Autoren

Armand Ruiz

Vice President, Product Management - AI Platform (watsonx.ai & watsonx.gov)

IBM

Product Manager, watsonx.ai

IBM

OpenAI hat zwei Modelle der künstlichen Intelligenz für die Öffentlichkeit freigegeben, die es Entwicklern und Unternehmen ermöglichen, sie herunterzuladen, auszuführen und frei anzupassen. Eines der Modelle wird jetzt im watsonx.ai Developer Studio von IBM gehostet.

Es ist das erste Mal seit 2019, dass OpenAI einen solchen Schritt gemacht hat. In den letzten fünf Jahren hat sich das Unternehmen fast ausschließlich darauf konzentriert, seine leistungsstärksten Modelle wie GPT-4, GPT-4o und seine Denkmodelle o3 und o4-mini über streng kontrollierte Schnittstellen anzubieten. Mit dieser neuesten Version werden zwei leistungsfähige Modelle direkt in die Hände der Nutzer gebracht, die sie lokal oder auf ihrer eigenen Infrastruktur ohne Einschränkungen der kommerziellen Nutzung ausführen können.

Warum OpenAI-Modelle auf watsonx.ai verwenden

Eines der beiden Modelle, das größere gpt-oss-120b, wird ab heute auf der watsonx.ai-Plattform von IBM verfügbar gemacht. IBM sagte, das Modell kann sicher in der Unternehmensinfrastruktur bereitgestellt, mit internen Daten angepasst und in reale Workflows in Branchen wie Gesundheitswesen, Finanzdienstleistungen und Rechtsberatung eingebettet werden. Das zweite Modell, gpt-oss-20b, wird ebenfalls in Kürze zur Plattform hinzugefügt. Entwicklungsteams werden bald auch in der Lage sein, diese Modelle von watsonx.ai zu nutzen, wenn sie Agenten in watsonx Orchestrate erstellen.

IBM watsonx.ai ermöglicht es Unternehmen, KI-Anwendungen über eine einheitliche Entwicklungsplattform zu entwickeln, bereitzustellen und zu skalieren. Es bietet Entwicklern die Flexibilität und die Wahl, ein Foundation Model anzupassen, auf eine breite Palette vorgefertigter, benutzerdefinierter und Open-Source-Tools zuzugreifen, die Vorteile führender Frameworks zu nutzen und hybride Bereitstellungsoptionen für Cloud und On-Prem zu nutzen, um ein schnelles Experimentieren und eine Beschleunigung der Time-to-Value für das Unternehmen zu ermöglichen, um ein Foundation Model anzupassen, auf eine breite Palette vorgefertigter, benutzerdefinierter und Open-Source-Tools zuzugreifen, die Vorteile führender Frameworks zu nutzen und hybride Bereitstellungsoptionen für Cloud und On-Prem zu nutzen, die schnelles Experimentieren ermöglichen und die Zeit bis zur Wertschöpfung für das Unternehmen beschleunigen.

Die Verfügbarkeit von gpt-oss auf watsonx.ai ist eine weitere Option für eine wachsende Auswahl an offenen Modellen, die auf der Plattform gehostet werden, und bietet Teams, die Agenten in watsonx Orchestrate erstellen, mehr Auswahl. Indem den Benutzern Zugriff auf erstklassige offene Modelle in watsonx geboten wird, darunter auch Modelle von Drittanbietern wie Meta und Mistral sowie IBMs eigenes Granite, besteht das Ziel darin, eine Kultur der Zusammenarbeit und Flexibilität für Kunden zu fördern, die generative KI bereitstellen.

Auf Flexibilität ausgelegt

Das größere Modell, gpt-oss-120b, enthält 116,8 Milliarden Parameter und verwendet eine Mixture of Experts (MoE)-Architektur, was bedeutet, dass immer nur ein Teil des Modells aktiv ist. Dieses Design ermöglicht eine effiziente Ausführung auf einer einzigen NVIDIA H100 GPU, die häufig in einem Rechenzentrum eingesetzt wird. Das kleinere Modell, gpt-oss-20b, ist für Consumer-Geräte wie Laptops mit 16 GB Arbeitsspeicher optimiert.

Beide Modelle unterstützen anpassbare Argumentationsstufen – niedrig, mittel oder hoch –, sodass Benutzer die Qualität der Ausgabe gegen Kosten und Geschwindigkeit abwägen können. Die Modelle erzeugen auch vollständige Argumentationsketten als Ausgabe, sodass die Benutzer sehen können, wie eine Schlussfolgerung gezogen wurde, anstatt nur die endgültige Antwort zu erhalten. OpenAI sagt, dass dies die Transparenz verbessert und die Modelle leichter zu debuggen und vertrauenswürdig zu machen macht.

OpenAI veröffentlichte Benchmark-Ergebnisse, die zeigen, dass das größere Modell bei mehreren Argumentations- und Mathematikaufgaben wettbewerbsfähig abschneidet. Beim MMLU-Benchmark, einem Standardtest für Allgemeinwissen, erzielte es die Punktzahl 90. Im GPQA-Benchmark erzielte es einen Score von 80,1. Beim AIME-Mathetest 2025 erreichte es eine Punktzahl von 97,9, was auf starke Funktionen im symbolischen Denken hindeutet.

Die Modelle beinhalten kein Bild-, Audio- oder Videoverständnis und sind nicht mit Inhaltsfiltern oder Moderationssystemen ausgestattet. Sie sind rein textbasiert, und es wird erwartet, dass die Benutzer je nach Bereitstellung der Modelle ihre eigenen Sicherheitsvorkehrungen treffen. Benutzer können Granite Guardian zusammen mit gpt-oss nutzen, um als Leitplankenmodell zur Erkennung von Risiken in Prompts und Antworten zu dienen.

Open-Source-Welle

Die Veröffentlichung von gpt-oss erfolgt zu einem Zeitpunkt, an dem offene Modelle an Dynamik gewinnen, und unterstreicht IBMs offene, Multi-Modell-Strategie und das Engagement des Unternehmens, sowohl Entwicklern als auch Geschäftsanwendern Zugang zu den fortschrittlichsten KI-Technologien zu verschaffen. Wie IBMs eigenes Granite haben Metas Lama, Mistral und die Qwen-Familie von Alibaba alle eine breite Akzeptanz bei Entwicklern und Forschern gefunden, die nach Tools suchen, die unabhängig voneinander geprüft, verbessert und eingesetzt werden können.

Modelle mit offener Gewichtung bieten eine Alternative zu kommerziellen Blackbox-Systemen und ermöglichen eine bessere Untersuchung des Modellverhaltens.

Für OpenAI signalisiert die Veröffentlichung von gpt-oss die Bereitschaft, sich auf diese Dynamik einzulassen, auch wenn das Unternehmen seine fortschrittlichsten Systeme weiterhin nur über kommerzielle Schnittstellen anbietet und weiterhin fortsetzt. Die Apache 2.0-Lizenz bietet Benutzern weitgehende Freiheit, auf den Modellen aufzubauen, ohne Einschränkungen bei der Weiterverteilung oder der Verwendung in proprietären Anwendungen.

„Die Zukunft ist hybrid“, sagte Bruno Azize, IBM Vice President for Data, AI & Analytics Strategy, in einer aktuellen Folge des Podcasts„Mixture of Experts“ . "Es wird nicht das eine Modell geben, das sie alle beherrscht ... Es wird nicht nur geschlossen oder offen sein. Das Unternehmen wird beides bekommen.“

Jetzt starten

Durch die Bereitstellung von gpt-oss-120B in watsonx.ai ermöglicht IBM Entwicklern, Data Scientists und Unternehmen Folgendes:

Bereitstellen offener Modelle auf ihrer eigenen Infrastruktur mit voller Kontrolle über Daten und Rechenleistung
Anpassen und Feinabstimmung des Modells für spezielle Anwendungsfälle – vom Gesundheitswesen über das Finanzwesen bis hin zum Kundensupport
Entwickeln von KI-Anwendungen, die die nativen Tool-Nutzungs-Funktionen des Modells nutzen

Ganz gleich, ob Sie interne Assistenten erstellen, Workflows automatisieren oder neue Anwendungsfälle für generative KI erkunden, gpt-oss-120B auf watsonx.ai bietet die Flexibilität und Power, alles zu tun – sicher und transparent.

Erkunden Sie gpt-oss-120B in watsonx.ai und beginnen Sie mit einem der leistungsfähigsten offenen Modelle auf dem Markt.

Mehr erfahren