Modelli open source di OpenAI disponibili su IBM watsonx.ai

Autori

Armand Ruiz

Vice President, Product Management - AI Platform (watsonx.ai & watsonx.gov)

IBM

Product Manager, watsonx.ai

IBM

OpenAI ha rilasciato al pubblico due modelli di intelligenza artificiale, consentendo agli sviluppatori e alle aziende di scaricarli, eseguirli e personalizzarli liberamente. Uno dei modelli è ora in hosting nell'ambiente watsonx.ai di IBM.

È la prima volta che OpenAI compie un'azione di questo tipo dal 2019. Negli ultimi cinque anni, l'azienda si è concentrata quasi interamente sull'offerta dei suoi modelli più potenti, come GPT-4, GPT-4o e i suoi modelli di ragionamento o3 e o4-mini, attraverso interfacce strettamente controllate. Quest'ultima versione mette un paio di modelli capaci direttamente nelle mani degli utenti, che possono eseguirli localmente o sulla propria infrastruttura senza restrizioni sull'uso commerciale.

Perché usare i modelli OpenAI su watsonx.ai

Uno dei due modelli, il più grande gpt-oss-120b, è reso disponibile oggi sulla piattaforma watsonx.ai di IBM. IBM ha affermato che il modello può essere distribuito in modo sicuro all'interno dell'infrastruttura aziendale, personalizzato utilizzando dati interni e integrato nei workflow del mondo reale in settori come l'assistenza sanitaria, i servizi finanziari e il supporto legale. Anche il secondo modello, gpt-oss-20b, sarà presto aggiunto alla piattaforma. I team di sviluppo saranno presto in grado di utilizzare questi modelli di watsonx.ai per la creazione di agenti all'interno di watsonx Orchestrate.

IBM watsonx.ai consente alle aziende di sviluppare, implementare e scalare le applicazioni AI in una piattaforma di sviluppo unificata. Offre agli sviluppatori la flessibilità e la possibilità di personalizzare un foundation model, accedere a un'ampia gamma di strumenti precostituiti, personalizzati e open source, utilizzare al meglio i principali framework e utilizzare opzioni di implementazioni ibride per il cloud e on-premise, consentendo una rapida sperimentazione e accelerando il time to value per l'azienda. personalizzare un foundation model, accedere a un'ampia gamma di strumenti precostituiti, personalizzati e open source, utilizzare al meglio i principali framework e utilizzare opzioni di implementazioni ibride per il cloud e on-premise, consentendo una rapida sperimentazione e accelerando il time to value per l'azienda.

La disponibilità di gpt-oss su watsonx.ai aggiunge un'altra opzione a un menu crescente di modelli aperti in hosting sulla piattaforma e aggiungerà maggiore scelta per gli agenti di team building in watsonx Orchestrate. L'offerta agli utenti dell'accesso a modelli aperti di alto livello in watsonx, inclusi modelli di terze parti come Meta e Mistral e Granite di IBM, ha come obiettivo la promozione di una cultura di collaborazione e flessibilità per i clienti che implementano l'AI generativa.

Realizzato per la flessibilità

Il modello più grande, gpt-oss-120b, contiene 116,8 miliardi di parametri e utilizza un'architettura Mixture of Experts (MoE), il che significa che solo una parte del modello è attiva in qualsiasi momento. Questo design gli consente di funzionare in modo efficiente su una singola GPU NVIDIA H100, ampiamente utilizzata nei data center. Il modello più piccolo, gpt-oss-20b, è ottimizzato per dispositivi di livello consumer come laptop con 16 GB di memoria.

Entrambi i modelli supportano livelli di ragionamento regolabili, bassi, medi o alti, in modo che gli utenti possano bilanciare la qualità dell'output con i costi e la velocità. I modelli producono anche catene di ragionamento complete, che consentono agli utenti di vedere come è stata raggiunta una conclusione, anziché ricevere solo la risposta finale. Secondo OpenAI, ciò migliora la trasparenza e rende i modelli più affidabili e facili da correggere.

OpenAI ha pubblicato benchmark che dimostrano che il modello più grande si comporta in modo competitivo in diverse attività di ragionamento e matematica. Nel benchmark MMLU, un test standard di cultura generale, ha ottenuto un punteggio di 90. Nel benchmark scientifico GPQA, ha ottenuto un punteggio di 80,1. Nel test di matematica AIME 2025, ha ottenuto un punteggio di 97,9, suggerendo ottime funzionalità di ragionamento simbolico.

I modelli non includono la comprensione di immagini, audio o video e non sono dotati di filtri dei contenuti o sistemi di moderazione. Sono di solo testo e ci si aspetta che gli utenti implementino le proprie misure di protezione a seconda di come vengono distribuiti i modelli. Gli utenti possono utilizzare Granite Guardian insieme a gpt-oss per fungere da modello guardrail che aiuta a rilevare i rischi nei prompt e nelle risposte.

Impennata dell'open source

Il rilascio di gpt-oss arriva in un momento in cui i modelli aperti stanno guadagnando slancio e sottolinea ulteriormente la strategia aperta e multimodello di IBM e la dedizione dell'azienda a fornire sia agli sviluppatori che agli utenti business l'accesso alle tecnologie AI più avanzate disponibili. Come Granite di IBM, LLaMA di Meta, Mistral e la famiglia Qwen di Alibaba hanno tutti trovato un'ampia adozione tra sviluppatori e ricercatori alla ricerca di strumenti che possano essere controllati, migliorati e distribuiti in modo indipendente.

I modelli aperti offrono un'alternativa ai sistemi black box commerciali, consentendo un maggiore controllo del comportamento del modello.

Per OpenAI, il rilascio di gpt-oss indica la volontà di interagire con queste dinamiche, anche se continua a offrire i suoi sistemi più avanzati solo attraverso interfacce commerciali. La licenza Apache 2.0 offre agli utenti ampia libertà di sviluppare modelli, senza restrizioni sulla ridistribuzione o sull'utilizzo in applicazioni proprietarie.

"Il futuro è ibrido", ha dichiarato Bruno Aziza, Vice President for Data, AI & Analytics Strategy di IBM, in un recente episodio del podcast Mixture of Experts . "Non ci sarà un modello unico per governarli tutti... non ci saranno solo modelli chiusi o aperti. L'azienda realizzerà entrambi."

Inizia oggi stesso

Rendendo disponibile gpt-oss-120B in watsonx.ai, IBM consente a sviluppatori, data scientist e aziende di:

distribuire modelli aperti sulla propria infrastruttura con il pieno controllo su dati e calcolo;
personalizzare e mettere a punto il modello per casi d'uso specializzati, dalla sanità alla finanza al supporto clienti;
sviluppare applicazioni AI che sfruttino le funzionalità native di utilizzo degli strumenti del modello.

Che stia creando assistenti interni, automatizzando il workflow o esplorando nuovi casi d'uso per l'AI generativa, gpt-oss-120B su watsonx.ai offre la flessibilità e la potenza per fare tutto, in modo sicuro e trasparente.

Esplora GPT-OSS-120b in watsonx.ai e inizia a creare con uno dei modelli aperti più capaci disponibili.

Maggiori informazioni