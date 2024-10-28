IBM sta rilasciando i suoi modelli Granite 3.0 come software open source con licenza Apache 2.0, adottando un approccio nettamente diverso da quello degli sviluppatori che mantengono privati i sistemi AI. L'azienda ha costruito i suoi modelli utilizzando set di dati pubblici come GitHub Code Clean e StarCoder, permettendo loro di evitare le questioni di copyright che hanno portato a cause legali contro aziende di AI che addestrano i modelli su contenuti protetti, come l' attuale caso di News Corp contro Perplexity.

La versione include modelli linguistici 8B e 2B focalizzati su compiti aziendali come la retrieval-augmented generation e classificazione, insieme a varianti specializzate per l'istruzione e il monitoraggio della sicurezza. Supportando 116 linguaggi di programmazione e addestrati su 3-4 terabyte di token, i modelli sono disponibili su più piattaforme, tra cui Hugging Face, GitHub e IBM watsonx.ai. I modelli variano da 3 a 34 miliardi di parametri e possono essere utilizzati per la ricerca e per applicazioni commerciali senza restrizioni in versioni nominalmente "open source".

"Avere questa diversità di pensiero e contribuire come parte di questo ecosistema aperto è una proposta molto più entusiasmante che tenere i nostri modelli chiusi in una scatola", afferma Kate Soule, Program Director of Data and Model Factory presso IBM Research. "Vogliamo che la comunità ne faccia uso."

Il movimento open source ha guadagnato slancio anche in Europa, dove Mistral AI è emersa come leader del settore. La startup con sede a Parigi ha rilasciato modelli sempre più capaci che gli sviluppatori possono scaricare e modificare liberamente.

La strategia open source crea uno scambio bidirezionale: le aziende condividono i modelli AI ottenendo al tempo stesso gli insight di migliaia di sviluppatori che trovano nuovi usi per questa tecnologia. Limitare l'accesso, sostengono molti, significa perdere questa innovazione collettiva.

"Immagina che esista qualche piccola modifica nuova all'architettura del tuo modello che, anche lasciando tutto il resto invariato, migliorerebbe significativamente le prestazioni complessive", afferma Dave Bergmann, Senior Writer presso IBM Think. "Se pubblichi il tuo modello solo come open weight e rifiuti di divulgare informazioni e codice per la sua architettura, potresti non cogliere mai questa opportunità. Ma se 20.000 persone si cimentano con il codice del tuo modello, qualcuno se ne accorgerà."