È un momento entusiasmante per l'AI for Business Man mano che applichiamo la tecnologia in modo più ampio in aree che vanno dal servizio clienti alle risorse umane alla modernizzazione del codice, l'intelligenza artificiale (AI) sta aiutando sempre più persone a lavorare in modo più intelligente anziché più duramente. E dato che siamo appena all'inizio della rivoluzione dell'AI for Business, il potenziale per migliorare produttività e creatività è enorme.
Ma oggi l'AI è un campo incredibilmente dinamico, e le piattaforme di AI devono riflettere questo dinamismo, incorporando le ultime innovazioni per soddisfare le esigenze di oggi e di domani. Ecco perché noi di IBM continuiamo ad aggiungere nuove e potenti funzionalità a IBM® watsonx, il nostro portfolio di prodotti di AI.
Oggi annunciamo la nostra ultima aggiunta: una nuova famiglia di foundation model costruiti da IBM che saranno disponibili in watsonx.ai, il nostro studio per AI generativa, foundation model e machine learning. Collettivamente denominati “Granite,” questi foundation model multidimensionali applicano l'AI generativa sia al linguaggio che al codice. E proprio come il granito è un materiale resistente e polifunzionale con molti usi nell'edilizia e nella produzione, anche noi di IBM crediamo che questi modelli Granite porteranno un valore duraturo alla tua azienda.
Ma ora diamo un'occhiata dietro le quinte e spieghiamo un po' come li abbiamo costruiti e come ti aiuteranno a portare l'AI al livello successivo nel tuo business.
Sviluppati da IBM® Research, i modelli Granite, cioè Granite.13b.instruct e Granite.13b.chat, utilizzano un'architettura "Decoder", ovvero ciò che sostiene la capacità dei modelli linguistici di grandi dimensioni odierni di prevedere il termine successivo in una sequenza.
Con 13 miliardi di modelli di parametri, i modelli Granite sono più efficienti dei modelli più grandi, in quanto possono essere installati su una singola GPU V100-32GB. Possono anche avere un impatto minore sull'ambiente pur ottenendo buoni risultati in compiti specializzati del business come riassunto, risposta a domande e classificazione. Sono ampiamente applicabili in diversi settori e supportano altri compiti NLP come la generazione di contenuti, l'estrazione di insight e retrieval-augmented generation (un framework per migliorare la qualità delle risposte collegando il modello a fonti esterne di conoscenza) e named entity recognition (identificazione ed estrazione di informazioni chiave in un testo).
In IBM siamo estremamente concentrati sulla costruzione di modelli rivolti al business. La famiglia di modelli Granite non fa eccezione, quindi li abbiamo addestrati su una varietà di set di dati (per un totale di 7 TB prima della pre-elaborazione, 2,4 TB dopo la pre-elaborazione) per produrre 1 trilione di token, la raccolta di caratteri che ha significato semantico per un modello. La nostra selezione di set di dati è rivolta alle esigenze degli utenti business e include dati provenienti dai seguenti domini:
Addestrando i modelli su set di dati specializzati per le aziende, garantiamo che i nostri modelli abbiano familiarità con il linguaggio e il gergo specialistico di questi settori e prendano decisioni basate sulla conoscenza del settore.
Negli affari, la fiducia è la tua licenza per operare. "Fidati di noi" non è un argomento valido, soprattutto quando si parla di AI. Essendo una delle prime aziende a sviluppare l'AI aziendale, l'approccio di IBM allo sviluppo dell'AI è guidato da principi fondamentali basati su impegni di fiducia e trasparenza. I prodotti IBM® Watsonx ti permettono di andare oltre l'essere un utente AI e diventare un creatore di valore AI. Ha un processo end-to-end per la costruzione e il test di foundation model e AI generativa concentrato su governance, valutazione del rischio, mitigazione dei bias e conformità. Questo processo inizia con la raccolta dei dati e termina con punti di controllo per il tracciamento delle distribuzioni responsabili dei modelli e delle applicazioni.
Poiché i clienti potranno adattare i modelli Granite alle proprie applicazioni, ogni set di dati utilizzato durante l'addestramento è sottoposto a un processo definito di revisione di governance, rischio e conformità (GRC). Abbiamo sviluppato procedure di governance per incorporare in IBM® Data Pile dati coerenti con i principi di IBM AI Ethics. La gestione dei criteri GRC per i dati riguarda l'intero ciclo di vita dei dati di formazione. Il nostro obiettivo è stabilire un collegamento verificabile da un foundation model addestrato fino alla versione specifica del set di dati su cui il modello è stato addestrato.
Molta attenzione mediatica si è (giustamente) concentrata sul rischio che l'AI generativa produca output diffamatori o contenuti di odio. In IBM, sappiamo che le aziende non possono permettersi di correre un rischio del genere, quindi i nostri modelli Granite sono addestrati su dati esaminati dal nostro "rilevatore HAP", un modello linguistico addestrato da IBM per rilevare e sradicare contenuti di odio e offensivi (da "hateful and profane", o "HAP"), che è confrontato rispetto a modelli interni e pubblici. Dopo aver assegnato un punteggio a ciascuna frase di un documento, viene eseguita l'analytics sulle frasi e sui punteggi per esplorarne la distribuzione, che determina la percentuale di frasi da filtrare.
Oltre a ciò, applichiamo una vasta gamma di altre misure di qualità. Cerchiamo e rimuoviamo duplicazioni che migliorano la qualità dell'output e utilizziamo filtri per la qualità dei documenti per rimuovere ulteriormente documenti di bassa qualità non adatti alla formazione. Distribuiamo anche in modo regolare e continuo misure di protezione dei dati, fra cui il monitoraggio di siti web noti per la pirateria di materiali o la pubblicazione di altri contenuti offensivi, per evitarli.
E poiché il panorama della tecnologia AI generativa è in costante cambiamento, il nostro processo end-to-end evolverà e migliorerà continuamente, offrendo alle aziende risultati che possono essere affidati.
La chiave della visione di IBM dell'AI for Business è il concetto di empowerment. Ogni organizzazione implementerà i modelli Granite per raggiungere i propri obiettivi, e ogni impresa ha le proprie normative a cui conformarsi, siano esse derivanti da leggi, norme sociali, standard di settore, richieste di mercato o requisiti architettonici. Crediamo che le imprese debbano essere autorizzate a personalizzare i propri modelli secondo i propri valori (entro certi limiti), ovunque risiedano i loro workload, utilizzando gli strumenti watsonx.
Ma non è tutto. Qualunque cosa tu faccia in Watsonx, manterrai sempre la proprietà dei tuoi dati. Non utilizziamo i tuoi dati per addestrare i nostri modelli: sei tu a mantenere il controllo dei modelli che crei e puoi portarli ovunque.
I modelli Granite iniziali sono solo l'inizio: ne sono previsti altri in altre lingue e sono in preparazione altri modelli addestrati da IBM. Nel frattempo, continuiamo ad aggiungere modelli open source a Watsonx. Di recente, abbiamo annunciato che IBM sta ora offrendo il modello Llama 2-chat di Meta con 70 miliardi di parametri a clienti selezionati per l'accesso anticipato e prevediamo di renderlo ampiamente disponibile entro settembre. Inoltre, IBM ospiterà StarCoder, un modello linguistico di grandi dimensioni per il codice, che include oltre 80+ linguaggi di programmazione, commit Git, problemi GitHub e Jupyter Notebook.
Oltre ai nuovi modelli, IBM sta lanciando anche nuove funzionalità complementari nello studio watsonx.ai. A fine mese arriverà la prima edizione del nostro Tuning Studio, che includerà prompt tuning, un modo efficiente e a basso costo per i clienti di adattare i foundation model ai loro compiti specifici a valle attraverso l'addestramento dei modelli su dati affidabili. Lanceremo anche il nostro Synthetic Data Generator, che aiuterà gli utenti a creare set di dati tabulari artificiali da schemi di dati personalizzati o set di dati interni. Questa caratteristica consentirà agli utenti di estrarre insight per l'addestramento e la messa a punto dei modelli AI o le simulazioni di scenari con rischio ridotto, aumentando il processo decisionale e accelerando il time to market.
L'aggiunta dei foundation model Granite e di altre funzionalità in watsonx apre nuove ed entusiasmanti possibilità nell'AI for Business. Con nuovi modelli e nuovi strumenti arrivano nuove idee e nuove soluzioni. E la parte migliore di tutto? Siamo solo all'inizio.
Le dichiarazioni relative alla direzione e agli intenti futuri di IBM sono soggette a modifiche o ritiri senza preavviso e rappresentano solo obiettivi e traguardi.