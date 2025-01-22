I modelli linguistici di grandi dimensioni (LLM) hanno dominato la conversazione sull'AI, alimentata dalla popolarità di ChatGPT e altre app di gen AI. Tuttavia, i modelli linguistici di piccole dimensioni (SLM) sono in crescita. Più compatti ed efficienti, gli SLM utilizzano meno memoria e potenza di calcolo. Questo li rende adatti per ambienti con risorse limitate.
La loro capacità di produrre contenuti unici e insight da vasti set di dati ha affascinato il mondo e ha stimolato nuovi strumenti e app, consolidando ulteriormente il loro impatto culturale, soprattutto in ambito aziendale. Con il Dr. Juan Bernabe Moreno, Director of IBM Research Europe for UK and Ireland, esploreremo come gli SLM possono trarre beneficio dall'adozione dell'AI nelle aziende.
L'intelligenza artificiale generativa (gen AI) ha un potenziale di produttività significativo per le aziende. Tuttavia, quando si implementano modelli AI, più grande non è sempre sinonimo di migliore. Ci sono due principali problemi legati agli LLM che ostacolano l'adozione da parte delle imprese.
In primo luogo, molti LLM sono di uso generale, il che ne limita il valore. I modelli aziendali "medi" sono inefficaci perché non esiste un'azienda "media". Modelli AI efficaci devono essere costruiti, ottimizzati e implementati in base alle specifiche esigenze organizzative.
In secondo luogo, molti LLM proprietari sono "black box", un modello chiuso di cui solo l'azienda che ne possiede può vedere i componenti, che mancano di trasparenza dei dati e ostacolano la sintonizzazione con i dati aziendali, dove risiede il vero valore dell'AI. Questo lascia le imprese responsabili delle prestazioni del modello senza insight o controllo.
Questi problemi ostacolano la fiducia e la comprensione della sicurezza dei modelli. Senza scegliere efficacemente soluzioni di gen AI per soddisfare i requisiti di settore, legali e normativi, le aziende non possono beneficiare appieno della potenza della gen AI.
Per una gen AI di successo, le aziende necessitano di tre cose:
Per soddisfare queste esigenze e massimizzare il valore dell'AI, le aziende si stanno rivolgendo agli SLM e scoprendo il potere dei piccoli modelli. Gli SLM offrono un'alternativa interessante agli LLM a uso generale.
Gli SLM hanno ricevuto molta meno attenzione e clamore, tuttavia offrono un'opzione interessante per le organizzazioni di qualsiasi dimensione. La loro efficienza energetica, la trasparenza dei dati e le forti prestazioni (che spesso corrispondono o superano i modelli più grandi), sbloccano l'adozione responsabile della gen AI senza ostacolare l'innovazione.
In genere, qualsiasi valore inferiore a 30 miliardi di parametri è considerato un SLM. I vantaggi principali includono costi inferiori, riduzione del consumo energetico e miglioramento della trasparenza e dell'integrità dei dati. Una nuova generazione di modelli più piccoli, come IBM Granite, basati su set di dati puliti e filtrati per compiti specifici, riduce i rischi come le distorsioni e gli output inappropriati, aumentando al contempo la visibilità dei dati.
Questo modello di base affidabile consente un'integrazione sicura dei dati proprietari, sbloccando il vero valore dell'AI. IBM fornisce un'indennità di proprietà intellettuale (IP) per tutti i modelli Granite, aumentando ulteriormente la fiducia nella fusione dei propri dati con i modelli.
IBM ritiene che i modelli di base open source consentano alle organizzazioni di creare modelli specializzati e dati integrati. Per supportare questa iniziativa, IBM ha reso open source la sua famiglia Granite di SLM personalizzabili, addestrati su set di dati trasparenti e filtrati.
La combinazione di un piccolo modello Granite con dati aziendali può ottenere prestazioni specifiche per attività che competono con modelli più grandi a una frazione del costo. Le prime prove di concetto mostrano che i modelli IBM Granite costano significativamente meno (tra 3 e 23 volte meno) rispetto ai modelli di frontiera di grandi dimensioni, mentre superano o eguagliano i concorrenti di dimensioni simili su benchmark chiave.
Inoltre, nuove tecniche come InstructLab, introdotto da IBM e RedHat nel maggio 2024, semplificano l'integrazione di dati aziendali negli LLM. InstructLab consente alle aziende di personalizzare i modelli AI utilizzando molte meno informazioni generate dall'uomo e risorse di calcolo rispetto al tradizionale riaddestramento.
Gli SLM, compresi i modelli Granite, stanno già avendo un impatto. Istituzioni sportive globali utilizzano i modelli Granite, perfezionati con i propri dati di dominio, per migliorare le esperienze dei tifosi con commenti generati dall'AI. Internamente, IBM utilizza modelli Granite per alimentare la sua piattaforma di servizi delle risorse umane (HR), AskHR. Utilizzando prompt in linguaggio naturale, i dipendenti IBM possono accedere ai servizi HR in un unico posto, il che consente di risparmiare tempo sia ai dipendenti che ai professionisti dell'HR.
I vasti LLM non sono l'unico modo per trarre beneficio dalla gen AI. I modelli specializzati, più piccoli e accessibili, offrono l'efficienza, la fiducia, la flessibilità e le prestazioni necessarie a un costo inferiore, dal punto di vista finanziario e ambientale.
