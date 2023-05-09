Siamo al confine di una rivoluzione dell'AI. Negli ultimi dieci anni, il deep learning è nato da una collisione epocale tra disponibilità di dati e potenza di calcolo, consentendo una serie di straordinarie funzionalità di AI. Ma abbiamo affrontato una sfida paradossale: l'automazione richiede molta manodopera. Sembra uno scherzo, ma non lo è, come chiunque abbia provato a risolvere problemi aziendali con AI saprà.
Gli strumenti di AI tradizionali, pur essendo potenti, possono essere costosi, lunghi e difficili da usare. I dati devono essere raccolti, resi accurati e etichettati con annotazioni specifiche per compito per addestrare i modelli AI. La costruzione di un modello richiede competenze specializzate, difficili da trovare, e ogni nuovo compito richiede la ripetizione del processo. Di conseguenza, le aziende si sono concentrate principalmente sull'automatizzazione di compiti con abbondanti dati e alto valore aziendale, lasciando tutto il resto sul tavolo. Ma le cose stanno iniziando a cambiare.
L'emergere dei transformer e dei metodi di apprendimento auto-supervisionato ci ha permesso di accedere a enormi quantità di dati non etichettati, aprendo la strada a grandi modelli pre-addestrati, talvolta chiamati "foundation model". Questi modelli di grandi dimensioni hanno ridotto i costi e la manodopera coinvolti nell'automazione.
I foundation model forniscono una base potente e versatile per una varietà di applicazioni di AI. Possiamo utilizzare i foundation model per eseguire rapidamente i compiti con dati annotati limitati e uno sforzo minimo; in alcuni casi, dobbiamo solo descrivere il compito da svolgere per convincere il modello a risolverlo.
Ma queste potenti tecnologie introducono anche nuovi rischi e sfide per le imprese. Molti dei modelli odierni sono addestrati su set di dati di qualità e provenienza sconosciute, portando a risposte offensive, distorto o fattualmente errate. I modelli più grandi sono costosi, richiedono molta energia per essere addestrati e sono complessi da distribuire.
Noi di IBM stiamo sviluppando un approccio che affronta le sfide fondamentali nell'uso dei foundation model per le imprese. Oggi abbiamo annunciato watsonx.ai, la porta di accesso di IBM agli strumenti e alle tecnologie di AI più recenti oggi disponibili sul mercato. A dimostrazione della rapidità con cui si sta evolvendo il settore, alcuni strumenti sono vecchi solo di poche settimane e, mentre scrivo, ne stiamo aggiungendo di nuovi.
Ciò che è incluso nel watsonx.ai, parte delle più grandi offerte Watsonx di IBM annunciate questa settimana, è vario e continuerà a evolversi, ma la nostra promessa principale è la stessa: fornire prodotti di automazione sicuri e pronti per l'azienda.
Fa parte del nostro lavoro continuo in IBM per accelerare il percorso dei nostri clienti nel trarre valore da questo nuovo paradigma dell'AI. Qui descriverò il nostro lavoro per costruire una suite di foundation model di livello aziendale, addestrato da IBM, compreso il nostro approccio ai dati e alle architetture dei modelli. Illustrerò anche il nostro nuovo portfolio e gli strumenti che consentono alle aziende di costruire e implementare soluzioni basate su foundation model utilizzando un ampio catalogo di modelli open source, oltre al nostro.
La qualità dei dati conta. Un modello AI addestrato su dati distorti o tossici tenderà naturalmente a produrre output distorti o tossici. Questo problema è aggravato nell'era dei foundation model, dove i dati utilizzati per addestrare i modelli provengono tipicamente da molte fonti e sono così abbondanti che nessun essere umano potrebbe ragionevolmente esaminarli tutti.
Poiché i dati sono il carburante che alimenta i foundation model, noi di IBM ci siamo concentrati nel rendere accurato tutto ciò che entra nei nostri modelli. Abbiamo sviluppato strumenti AI per filtrare in modo aggressivo i nostri dati per rilevare odio e oscenità, restrizioni di licenza e pregiudizi. Quando vengono identificati dati discutibili, li rimuoviamo, riqualifichiamo il modello e ripetiamo.
La data curation è un'attività che non finisce mai. Continuiamo a sviluppare e perfezionare nuovi metodi per migliorare la qualità dei dati e i controlli, per soddisfare una serie di requisiti legali e normativi in continua evoluzione. Abbiamo costruito un framework per tracciare i dati non elaborati che sono stati puliti, i metodi utilizzati e i modelli che ogni punto dati ha toccato.
Continua a raccogliere dati di alta qualità per affrontare alcune delle sfide aziendali più urgenti in diversi ambiti come finanza, diritto, cybersecurity e sostenibilità. Attualmente puntiamo a più di 1 terabyte di testo curato per l'addestramento dei nostri foundation model, aggiungendo al contempo codice software curato, dati satellite e dati e log di eventi di rete IT.
IBM sta sviluppando tecniche per integrare fiducia nel ciclo di vita del foundation model, per mitigare il bias e migliorare la sicurezza del modello. Il nostro lavoro in questo ambito include FairIJ, che identifica i punti dati distorti nei dati utilizzati per adattare un modello, così da poterli eliminare. Altri metodi, come la riprogrammazione dell'equità, ci consentono di mitigare i pregiudizi in un modello anche dopo che è stato addestrato.
Il nuovo studio watsonx.ai di IBM offre una suite di foundation model volti a fornire valore aziendale. Sono stati incorporati in una gamma di prodotti IBM che saranno resi disponibili ai clienti IBM nei prossimi mesi.
Riconoscendo che una soluzione non va bene per tutti, stiamo costruendo una famiglia di modelli di base di linguaggio e codice di diverse dimensioni e architetture, cioè foundation model. Ogni famiglia di modelli ha un nome in codice a tema geologico (Granite, Sandstone, Obsidian, and Slate) che riunisce innovazioni all'avanguardia provenienti da IBM® Research e dalla comunità di ricerca aperta. Ogni modello può essere personalizzato per una serie di attività aziendali.
I nostri modelli Granite si basano su un'architettura di soli decoder, simile a GPT, per attività generative. I modelli Sandstone utilizzano un'architettura encoder-decoder e sono ben adatti per la messa a punto di attività specifiche, intercambiabili con i popolari modelli T5 di Google. Obsidian utilizza una nuova architettura modulare sviluppata da IBM Research, che fornisce un'elevata efficienza di inferenza e livelli di prestazioni in una varietà di attività. Slate si riferisce a una famiglia di modelli basati solo su codificatori (RoBERTa) che, pur non essendo generativi, sono rapidi ed efficaci per molte attività NLP aziendali. Tutti i modelli watsonx.ai sono addestrati sul data lake reso accurato e focalizzato sull'enterprise di IBM, sul nostro supercomputer AI cloud-native progettato su misura, Vela.
Efficienza e sostenibilità sono principi fondamentali di progettazione per watsonx.ai. A IBM Research, abbiamo inventato nuove tecnologie per un addestramento efficiente dei modelli, tra cui il nostro algoritmo "LiGO" che ricicla piccoli modelli e li "fa crescere" in modelli più grandi. Questo metodo può far risparmiare dal 40% al 70% del tempo, dei costi e dell'output di carbonio necessari per addestrare un modello. Per migliorare le velocità di inferenza, stiamo sfruttando la nostra profonda esperienza nella quantizzazione, ovvero nella riduzione dei modelli dall'aritmetica a virgola mobile a 32 virgola a formati interi molto più piccoli. Ridurre la precisione dei modelli AI offre enormi benefici in termini di efficienza senza sacrificare la precisione. Speriamo di eseguire presto questi modelli compressi sul nostro chip ottimizzato per l'IA, IBM® AIU.
L'ultimo pezzo del puzzle dei foundation model è la creazione di un software facile da usare per l'ottimizzazione e la distribuzione dei modelli. Lo stack di inferenza ibrido cloud-native di IBM, basato su OpenShift, è stato ottimizzato per la formazione e la distribuzione di modelli di base. Le aziende possono utilizzare la flessibilità di OpenShift per eseguire modelli da qualsiasi luogo, inclusi quelli on-premise.
Abbiamo creato una suite in watsonx.ai che offre ai clienti un'interfaccia utente intuitiva e librerie adatte agli sviluppatori per costruire soluzioni basate su foundation model. Il nostro Prompt Lab consente agli utenti di eseguire rapidamente compiti di AI con solo pochi esempi etichettati. Tuning Studio consente una personalizzazione rapida e robusta del modello utilizzando i propri dati, basandosi su tecniche di fine-tuning efficienti e all'avanguardia sviluppate da IBM Research.
Oltre ai modelli IBM, watsonx.ai offre un accesso fluido a un ampio catalogo di modelli open-source per le aziende che possono sperimentare e iterare rapidamente. In una nuova partnership con Hugging Face, IBM offrirà migliaia di foundation model open source, set di dati e librerie in watsonx.ai. Hugging Face, a sua volta, offrirà tutti i modelli e gli strumenti proprietari e ad accesso aperto di IBM su watsonx.ai.
Per provare un nuovo modello, basta selezionarlo da un menu a tendina. Puoi trovare maggiori informazioni sullo studio qui.
I foundation model stanno cambiando il panorama dell'AI e i progressi negli ultimi anni non hanno fatto che accelerare. Noi di IBM siamo entusiasti di contribuire a tracciare le frontiere di questo campo in rapida evoluzione e tradurre l'innovazione in valore aziendale reale.
Scopri quattro strategie per scalare l'AI con una solida base di dati.
Scopri come i CEO possono trovare il giusto equilibrio tra il valore che l'AI generativa può creare, gli investimenti che richiede e i rischi che introduce.
Abbiamo intervistato 2.000 organizzazioni in merito alle loro iniziative di AI per scoprire cosa funziona, cosa non funziona e come giocare d'anticipo.
Scopri l'approccio agile all'AI, che consente alle organizzazioni di innovare rapidamente e ridurre il rischio di insuccesso.
Scopri come incorporare l'AI generativa, il machine learning e i foundation model nelle operazioni di business per migliorare le prestazioni.
Vuoi ottenere un ritorno migliore sui tuoi investimenti nell'AI? Scopri come lo scaling della GenAI in settori chiave può favorire il cambiamento, aiutando le tue menti migliori a creare e fornire nuove soluzioni innovative.
Esplora la storia dell'AI e scopri che cosa riserva il futuro alle aziende che ne stanno valutando l'adozione.
Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.