Mentre le aziende tecnologiche investono miliardi nell' intelligenza artificiale, si sta facendo strada una strategia controintuitiva: regalare il codice. Il passaggio a modelli AI open source riflette una crescente pressione a contenere i costi di sviluppo, accelerando le scoperte in un settore in cui talento e potenza di calcolo hanno un prezzo elevato.
Il landscape dell'AI sta cambiando: aziende come IBM, Meta e Mistral AI hanno adottato lo sviluppo open source, rendendo la sofisticata tecnologia AI liberamente disponibile a sviluppatori e ricercatori. Sebbene questo approccio possa democratizzare l'accesso e accelerare le scoperte attraverso la collaborazione, i critici avvertono che potrebbe permettere agli attori malintenzionati di usare o modificare la tecnologia a fini dannosi.
D'altro canto, i sostenitori affermano che lo sviluppo dell'AI open-source rende possibile ai ricercatori e agli sviluppatori di tutto il mondo di ispezionare, modificare e migliorare la tecnologia. Questo approccio collaborativo ha già prodotto progressi significativi nell'efficienza del modello. Ad esempio, i nuovi modelli AI Granite 3.0 di IBM raggiungono prestazioni paragonabili a quelle di sistemi più grandi, richiedendo solo una frazione delle risorse di calcolo.
IBM sta rilasciando i suoi modelli Granite 3.0 come software open source con licenza Apache 2.0, adottando un approccio nettamente diverso da quello degli sviluppatori che mantengono privati i sistemi AI. L'azienda ha costruito i suoi modelli utilizzando set di dati pubblici come GitHub Code Clean e StarCoder, permettendo loro di evitare le questioni di copyright che hanno portato a cause legali contro aziende di AI che addestrano i modelli su contenuti protetti, come l' attuale caso di News Corp contro Perplexity.
La versione include modelli linguistici 8B e 2B focalizzati su compiti aziendali come la retrieval-augmented generation e classificazione, insieme a varianti specializzate per l'istruzione e il monitoraggio della sicurezza. Supportando 116 linguaggi di programmazione e addestrati su 3-4 terabyte di token, i modelli sono disponibili su più piattaforme, tra cui Hugging Face, GitHub e IBM watsonx.ai. I modelli variano da 3 a 34 miliardi di parametri e possono essere utilizzati per la ricerca e per applicazioni commerciali senza restrizioni in versioni nominalmente "open source".
"Avere questa diversità di pensiero e contribuire come parte di questo ecosistema aperto è una proposta molto più entusiasmante che tenere i nostri modelli chiusi in una scatola", afferma Kate Soule, Program Director of Data and Model Factory presso IBM Research. "Vogliamo che la comunità ne faccia uso."
Il movimento open source ha guadagnato slancio anche in Europa, dove Mistral AI è emersa come leader del settore. La startup con sede a Parigi ha rilasciato modelli sempre più capaci che gli sviluppatori possono scaricare e modificare liberamente.
La strategia open source crea uno scambio bidirezionale: le aziende condividono i modelli AI ottenendo al tempo stesso gli insight di migliaia di sviluppatori che trovano nuovi usi per questa tecnologia. Limitare l'accesso, sostengono molti, significa perdere questa innovazione collettiva.
"Immagina che esista qualche piccola modifica nuova all'architettura del tuo modello che, anche lasciando tutto il resto invariato, migliorerebbe significativamente le prestazioni complessive", afferma Dave Bergmann, Senior Writer presso IBM Think. "Se pubblichi il tuo modello solo come open weight e rifiuti di divulgare informazioni e codice per la sua architettura, potresti non cogliere mai questa opportunità. Ma se 20.000 persone si cimentano con il codice del tuo modello, qualcuno se ne accorgerà."
Il rilascio da parte di Meta dei modelli Llama open source è stato un punto di svolta significativo. Voleva dire che una delle più grandi aziende tecnologiche dava ai ricercatori e alle piccole organizzazioni l'accesso a tecnologie avanzate AI che non avrebbero mai potuto permettersi di costruire in modo indipendente.
"Crediamo fondamentalmente che l'AI open source sia un bene per tutti, a partire dagli sviluppatori che possono prendere questi modelli, metterli a punto, addestrarli, distillarli e usarli ovunque vogliano", afferma Amit Sangani, Senior Director of AI Partner Engineering presso Meta, durante un recente incontro dell'AI Alliance. "Più l'AI è open source, più diventa trasparente e sicura. Viene ampiamente esaminata, e questa è una buona cosa, perché quando vengono individuati dei problemi, le persone, Meta compreso, li risolvono."
Nonostante i vantaggi, la tecnologia AI open source potrebbe comportare dei rischi. Alcuni osservatori affermano che i modelli AI open source possono essere modificati più facilmente per scopi dannosi, come generare disinformazione o creare malware. La mancanza di controllo centralizzato significa che, anche se gli sviluppatori originali aderiscono a elevati standard etici, le versioni modificate dei modelli potrebbero non farlo.
Tuttavia, i guadagni in termini di efficienza dimostrati da modelli come Granite 3.0 indicano un potenziale futuro in cui le funzionalità dell'AI diventeranno più accessibili alle organizzazioni con risorse limitate. Le piccole imprese che non possono permettersi di gestire modelli linguistici massicci potrebbero distribuire alternative open-source più piccole, più efficienti e personalizzate per le loro esigenze specifiche.
"L'open source consentirà una maggiore innovazione in più luoghi", afferma Dave Nielsen, direttore della community AI Alliance. "E questo non farà altro che generare più entusiasmo tra più imprenditori e più clienti, creando maggiori entrate."
