Scalare l'AI generativa con scelte di modelli flessibili

Un uomo, seduto accanto a una grande finestra in una biblioteca moderna, lavora al suo laptop.

Questa serie di blog sfata i miti dell'AI generativa (gen AI) per i leader aziendali e di tecnologia. Fornisce framework semplici e principi guida per il tuo percorso di intelligenza artificiale (AI) trasformativa. Nel blog precedente, abbiamo parlato dell'approccio differenziato di IBM nella fornitura dei modelli di livello aziendale. In questo blog approfondiamo perché le scelte dei foundation model sono importanti e come permettono alle aziende di scalare la gen AI con fiducia.

Perché le scelte del modello sono importanti?

Nel mondo dinamico della gen AI, gli approcci "a taglia unica" sono inadeguati. Mentre le aziende cercano di sfruttare la potenza dell'AI, avere a disposizione uno spettro di scelte di modelli è necessario per:

  • Stimolare l'innovazione: una palette diversificata di modelli non solo favorisce l'innovazione portando punti di forza distintivi per affrontare una vasta gamma di problemi, ma permette anche ai team di adattarsi alle esigenze aziendali in evoluzione e alle aspettative dei clienti.
  • Personalizzare per ottenere un vantaggio competitivo: una gamma di modelli consente alle aziende di adattare le applicazioni AI per esigenze di nicchia, offrendo un vantaggio competitivo. La gen AI può essere messa a punto per compiti specifici, che si tratti di rispondere alle domande delle applicazioni o di scrivere codice per generare rapidi riassunti.
  • Accelerare il time to market: nel frenetico ambiente commerciale di oggi, il tempo è fondamentale. Un portfolio diversificato di modelli può accelerare il processo di sviluppo, permettendo alle aziende di introdurre rapidamente offerte basate sull'AI. Questo è particolarmente cruciale nella gen AI, dove l'accesso alle ultime innovazioni offre un vantaggio competitivo fondamentale.
  • Rimanere flessibile di fronte ai cambiamenti: le condizioni di mercato e le strategie aziendali si evolvono costantemente. Le diverse scelte di modelli permettono alle aziende di cambiare rapidamente ed efficacemente. L'accesso a molteplici opzioni consente un adattamento rapido quando si verificano nuove tendenze o cambiamenti strategici, mantenendo agilità e resilienza.
  • Ottimizzare i costi tra i casi d'uso: modelli diversi hanno implicazioni di costo variabili. Accedendo a una gamma di modelli, le aziende possono selezionare l'opzione più conveniente per ogni applicazione. Mentre alcune attività potrebbero richiedere la precisione di modelli ad alto costo, altre possono essere affrontate con alternative più convenienti senza sacrificare la qualità. Ad esempio, nell'assistenza clienti, la velocità e la latenza potrebbero essere più critiche dell'accuratezza, mentre in risorse e sviluppo la precisione conta di più.
  • Mitigare i rischi: affidarsi a un singolo modello o a una selezione limitata può essere rischioso. Un portfolio diversificato di modelli aiuta a mitigare i rischi di concentrazione, contribuendo a garantire che le aziende rimangano resilienti alle carenze o al fallimento di un approccio specifico. Questa strategia consente la distribuzione del rischio e fornisce soluzioni alternative in caso di difficoltà.
  • Rispettare le normative: il panorama normativo dell'AI è ancora in evoluzione, con considerazioni etiche in primo piano. Modelli diversi possono avere implicazioni diverse per equità, privacy e conformità. Un'ampia selezione consente alle aziende di orientarsi in questo terreno complesso e scegliere modelli che soddisfano gli standard legali ed etici.

Selezionare i giusti modelli AI

Ora che abbiamo compreso l'importanza della selezione del modello, come risolviamo il problema del sovraccarico di scelta quando si seleziona il modello giusto per un caso d'uso specifico? Possiamo scomporre questo problema complesso in una serie di passaggi semplici che puoi applicare fin da oggi:

  1. Individua un caso d'uso chiaro: determina le esigenze e i requisiti specifici della tua applicazione aziendale. Ciò comporta la creazione di prompt dettagliati che tengano conto delle sottigliezze del tuo settore e della tua attività, per garantire che il modello sia strettamente allineato ai tuoi obiettivi.
  2. Elenca tutte le opzioni di modello: valuta vari modelli in base a dimensioni, accuratezza, latenza e rischi associati. Ciò include la comprensione dei punti di forza e di debolezza di ciascun modello, come i compromessi tra precisione, latenza e throughput.
  3. Valutare gli attributi del modello: valuta l'adeguatezza delle dimensioni del modello rispetto alle tue esigenze, considerando come la scala del modello potrebbe influenzare le sue prestazioni e i rischi connessi. Questa fase si concentra sul giusto dimensionamento del modello per adattarlo in modo ottimale al caso d'uso, in quanto le dimensioni maggiori non sono necessariamente migliori. I modelli più piccoli possono superare quelli più grandi in domini e casi d'uso mirati.
  4. Opzioni del modello di test: effettua test per verificare se il modello funziona come previsto in condizioni che imitano scenari reali. Questo comporta l'uso di benchmark e set di dati specifici per dominio per valutare la qualità dell'output e la modifica del modello, ad esempio tramite prompt engineering o la messa a punto del modello per ottimizzarne le prestazioni.
  5. Affina la tua selezione in base ai costi e alle esigenze di implementazione: dopo i test, affina la scelta considerando fattori come il ritorno sull'investimento, l'efficacia dei costi e le praticità dell'implementazione del modello all'interno dei tuoi sistemi e infrastrutture esistenti. Adegua la scelta in base ad altri benefici, come una minore latenza o una maggiore trasparenza.
  6. Scegli il modello che offre il maggior valore: scegli infine un modello di AII che offra il miglior equilibrio tra prestazioni, costi e rischi associati, su misura per le esigenze specifiche del tuo caso d'uso.

Libreria di modelli IBM® watsonx

Perseguendo una strategia multimodello, la libreria IBM watsonx offre modelli proprietari, open source e di terze parti, come mostrato nell'immagine:

Elenco dei foundation model di watsonx  all'8 maggio 2024. Elenco dei foundation model di watsonx  all'8 maggio 2024.

Ciò offre ai clienti una vasta gamma di possibilità di scelta, consentendo loro di selezionare il modello più adatto alle loro specifiche preferenze aziendali, regionali e di rischio.

Inoltre, watsonx consente ai clienti di distribuire modelli sull'infrastruttura di loro scelta, con opzioni multicloud ibrido e on-premise, per evitare il blocco da fornitore e ridurre il costo totale di proprietà.

IBM® Granite: foundation model di livello enterprise di IBM

Le caratteristiche dei foundation model possono essere raggruppate in 3 attributi principali. Le organizzazioni devono comprendere che enfatizzare eccessivamente una caratteristica potrebbe compromettere le altre. Bilanciare questi attributi è fondamentale per personalizzare il modello in base alle esigenze specifiche di un'organizzazione:

  1. Affidabili: modelli chiari, spiegabili e innocui.
  2. Performanti: il giusto livello di prestazioni per domini aziendali e casi d'uso mirati.
  3. Convenienti: modelli che offrono gen AI a un costo totale di proprietà inferiore e a rischio ridotto.

IBM Granite è una serie di modelli di punta di livello aziendale sviluppati da IBM® Research. Questi modelli hanno caratteristiche di un mix ottimale di questi attributi, con particolare attenzione alla fiducia e all'affidabilità, che consentono alle aziende di avere successo nelle iniziative di gen AI. Ricorda: le aziende non possono scalare l'AI generativa con foundation model di cui non possono fidarsi.

IBM watsonx offre modelli AI di livello aziendale risultanti da un rigoroso processo di perfezionamento. Questo processo inizia con l'innovazione del modello guidata da IBM Research, che prevede collaborazioni aperte e formazione su contenuti rilevanti per l'azienda, secondo il Codice etico dell'AI di IBM, per promuovere la trasparenza dei dati.

IBM Research ha sviluppato una tecnica di ottimizzazione delle istruzioni che migliora sia i modelli open source sviluppati da IBM sia quelli selezionati, con funzionalità essenziali per l'uso aziendale. Oltre ai benchmark accademici, il nostro set di dati "FM_EVAL" simula applicazioni di AI aziendale reale. I modelli più robusti di questa pipeline sono disponibili su IBM watsonx.ai, per fornire ai clienti foundation model di gen AI affidabili e di livello aziendale, come mostrato nell'immagine:

Foundation model di gen AI di livello aziendale

Ultimi modelli annunciati:

  • Modelli di codice Granite: una famiglia di modelli addestrati in 116 linguaggi di programmazione e con dimensioni che variano da 3 a 34 miliardi di parametri, sia in varianti di modello base che di modelli che seguono le istruzioni.
  • Granite-7b-lab: supporta attività di uso generale ed è ottimizzato utilizzando la metodologia di allineamento su larga scala dei chatbot (LAB) di IBM per incorporare nuove competenze e conoscenze.

Prova i nostri foundation model di livello aziendale su watsonx con la nostra nuova demo di watsonx.ai chat. Scopri le loro funzionalità in riassunto, generazione di contenuti e elaborazione documentale attraverso un'interfaccia di chat semplice e intuitiva.