Il 72% dei CEO di alto livello concorda sul fatto che, secondo l’IBM Institute for Business Value, avere gli strumenti di AI generativa più avanzati conferisce a un’organizzazione un vantaggio competitivo. Ma se questi strumenti di AI generativa non sono radicati nel contesto unico di un’azienda, le organizzazioni potrebbero non trarne il massimo vantaggio.
Per quanto potenti siano i grandi modelli di AI generativa generica come ChatGPT e Google Gemini, non sono addestrati su set di dati specifici per l’organizzazione. Quando sono collegati ai processi di un’organizzazione, potrebbero perdere informazioni importanti che possono confonderle e produrre risultati subottimali.
“Ogni azienda ha il suo linguaggio”, spiega Michael Choie, Senior Managing Consultant, AI and Analytics, IBM Consulting. “Prendiamo la parola ‘fascia’. Per una catena di supermercati, significherà ‘accessorio per capelli’. Per un ospedale, significherà ‘bendaggio per le ferite’.”
IBM ha collaborato con The Harris Poll per pubblicare AI in azione 2024, un sondaggio condotto su 2.000 organizzazioni in tutto il mondo. Il sondaggio ha rilevato che il 15% di queste organizzazioni (chiamate AI Leaders) sta ottenendo risultati quantificabili con l'AI.
Una cosa che distingue i leader dell'AI è la fiducia nella loro capacità di personalizzare gli sforzi dell'AI per ottenere un valore ottimale. Questo non significa che un'organizzazione debba costruire i propri modelli da zero per distinguersi dalla massa. Al contrario, può adattare modelli AI esistenti sfruttando l'unica cosa che nessun altro ha: i dati aziendali proprietari.
"Ogni fornitore di AI, come X o Google, ha accesso alle informazioni pubbliche. Hanno anche accesso ai dati delle proprie piattaforme," spiega Shobhit Varshney, Vicepresidente e Senior Partner, Americas AI Leader di IBM Consulting. "Ciò a cui non hanno accesso sono i dati aziendali. Quello è il pezzo che manca."
Come spiega Varshney in AI in azione 2024, "Il prossimo passo è far sì che l'AI superi il divario e entri in un'impresa in modo che possa assorbire, imparare e diventare il tuo vantaggio competitivo."
Ci sono tre modi principali per fornire dati proprietari a un modello di AI: prompt engineering, retrieval-augmented generation (RAG) e messa a punto.
In questo contesto, prompt engineering significa includere dati proprietari nel prompt che vengono passati all'AI.
Supponiamo che un utente desideri un modello AI per riepilogare le conversazioni del call center. L'utente può scrivere un prompt ("Riassumi questa conversazione") e allegare la trascrizione della chiamata come parte del prompt.
Il prompt engineering non richiede di modificare il modello stesso. È più adatto a compiti generici e di basso volume, dove è ragionevole includere il contesto necessario in ogni prompt.
La retrieval-augmented generation (RAG) significa collegare un modello AI a un database proprietario. Il modello può estrarre informazioni rilevanti da questo database rispondendo ai prompt.
Ad esempio, un'organizzazione può dare a un chatbot di servizio clienti l'accesso a un database di prodotti aziendali. Quando gli utenti fanno domande al chatbot su questi prodotti, questi possono consultare la documentazione corrispondente e recuperare la risposta corretta.
La RAG non richiede modifiche permanenti al modello. Può migliorare la precisione e ridurre le allucinazioni, ma può anche aumentare i tempi di risposta.
Messa a punto significa fornire a un modello AI abbastanza dati aggiuntivi per modificare alcuni dei suoi parametri. La messa a punto modifica in modo permanente il comportamento di un modello, adattandolo a un particolare caso d'uso o contesto. È anche più veloce ed economica rispetto all'addestramento di un modello da zero.
"Se si dispone di una rete neurale con 100 livelli diversi, addestrarla significherebbe modificare tutti i 100 livelli", spiega Choie. "La messa a punto fa sì che, in realtà, vengano modificati gli ultimi livelli. Stai comunque modificando il modello, ma non devi cambiarlo completamente perché funziona già bene."
La messa a punto richiede un investimento iniziale un po' più elevato rispetto a prompt engineering e RAG. È utile per trasformare un modello più piccolo in un esperto in un ambito specializzato. Ad esempio, una compagnia assicurativa può mettere a punto un modello per padroneggiare l'arte di elaborare nuove richieste.
Varshney paragona un modello ben messo a punto a un nuovo dipendente sottoposto a una formazione intensiva e appena uscito da scuola. Forse non hanno la stessa vastità di conoscenze di un genio poliedrico (o di un grande modello AI generico), ma sono molto più bravi a elaborare le affermazioni di quanto lo sarebbero loro.
"Non può fare la dichiarazione dei redditi o scrivere un contratto legale", afferma Varshney, "ma se gli chiedessi di elaborare una richiesta, saprebbe farlo".
L'utilizzo di dati proprietari in questi modi offre un significativo vantaggio competitivo familiarizzando i modelli AI con i processi, i prodotti, i clienti e altre sfumature unici di un'azienda.
"Se hai un'AI i cui principali utenti provengono da una particolare impresa, è importante che l'AI utilizzi i dati provenienti da quella stessa impresa," afferma Choie.
Quando i modelli AI hanno accesso a dati proprietari, sono ancorati a un contesto aziendale specifico, il che significa che anche i loro output sono basati su quel contesto.
"Posso prendere un modello AI aperto, metterlo a punto con i miei dati proprietari e quella copia sarà esclusivamente mia", afferma Varshney. "La proprietà intellettuale è mia. Lo eseguirò sulla mia infrastruttura."
Di conseguenza, questi modelli possono produrre output più accurati ed efficaci rispetto ai modelli non aumentati, pronti all'uso, che attingono da un insieme generale di dati pubblici.
Le organizzazioni possono utilizzare molti tipi diversi di modelli AI per ottenere Risultati. Ma i modelli open-source (come i modelli IBM® Granite, disponibili con licenza Apache 2.0 per un uso commerciale ampio e senza ostacoli) offrono alcuni vantaggi.
"Quando si addestra un modello AI, ci sono molti parametri e tecniche diversi da regolare per garantire che il modello impari in modo efficace ed efficiente. Servono data scientist specializzati ed esperti di machine learning per organizzare tutto questo," spiega Choie. "Il vantaggio di perfezionare i modelli aperti è che disponiamo di modelli su cui alcune persone brillanti hanno già messo le mani. Tutto ciò che dobbiamo fare è alimentare i modelli con dati aggiuntivi specifici per il compito e regolare alcuni livelli, è un compito molto più semplice rispetto alla costruzione di un modello."
Oltre a consentire alle organizzazioni di trarre beneficio dalla saggezza della massa, i modelli open source possono consentire loro di sperimentare senza che il costo del fallimento sia troppo elevato. Questa sperimentazione, a sua volta, aiuta le organizzazioni a perseguire una strategia multimodello, utilizzando molti modelli diversi (e calibrati in modo differente) per compiti specifici di dominio.
Questa strategia multimodello è considerata una best practice. AI in azione 2024 ha rilevato che il 62% dei leader AI utilizza modelli multipli, rispetto al 32% degli studenti AI.
"Utilizzare modelli open source è quasi una scelta ovvia", afferma Choie. "Sono convenienti, ci lavorano alcune delle persone migliori del settore e, ogni volta che ci sono aggiornamenti o problemi, la community ci lavora insieme."
Una gestione efficace dei dati è una delle caratteristiche chiave che distingue gli AI Leader dalle altre organizzazioni, secondo AI in Action 2024. Il 61% degli AI Leader crede nella propria capacità di accedere e gestire efficacemente i dati organizzativi per supportare le iniziative di AI, rispetto all'11% degli AI Learner.
Ma fornire dati proprietari ai modelli AI non è così semplice come sembra. I silos, il controllo della qualità e altri problemi possono ostacolare.
In termini generali, la soluzione consiste nell'implementare un data fabric integrato che elimini i silo, garantisca l'interoperabilità e orchestri il movimento fluido dei dati tra le piattaforme.
Ma che cosa significa nella pratica? Ecco alcune considerazioni chiave:
I primi ostacoli a molti sforzi di AI sono la raccolta e la memorizzazione dei dati, processi che non sono così semplici come potrebbero sembrare.
Catturare i dati nei database tradizionali spesso porta a silo che possono impedire a un'organizzazione di aggregare tutti i dati necessari per costruire un database RAG efficace o mettere a punto i modelli. Secondo IBM® Data Differentiator, l'82% delle aziende sperimenta silo di dati che ostacolano i loro workflow chiave.
Le organizzazioni devono implementare pipeline per recuperare dati da fonti eterogeneo, prepararli all'uso e depositarli in una memorizzare accessibile e centralizzata.
Il recupero e la preparazione dei dati possono comportare l'uso di strumenti di elaborazione dei flussi, come Apache Kafka, o di strumenti di integrazione dei dati pronti per l'ETL e l'ELT, come IBM® DataStage. Le organizzazioni devono anche scegliere i repository giusti per i dati, che possono includere:
Data lake, che offrono ambienti di storage a basso costo progettati per gestire enormi quantità di dati non strutturati e dati strutturati non elaborati.
Data warehouse, costruiti per supportare l'analisi dei dati, la business intelligence e le attività di data science.
Data lakehouse, come watsonx.data, che uniscono le funzionalità di magazzini e laghi in una sola soluzione di gestione dei dati.
Un'infrastruttura di hybrid cloud è anche un componente importante degli sforzi di integrazione dei dati. Oggi molte aziende dispongono di dati distribuiti tra archivi di dati on-premise e più servizi cloud.
"Bisogna assicurarsi di poter aggregare tutte queste informazioni, ovunque si trovino, e inserirle nei modelli AI", afferma Choie. "Se non si adotta un modello ibrido, ci si perde qualcosa."
Input errati portano a output errati. Le organizzazioni devono assicurarsi che i dati proprietari che forniscono ai modelli AI siano affidabili e accurati.
"Bisogna individuare il valore aggiunto dei dati, l'elemento differenziante, in modo da poterlo amplificare", afferma Varshney. "È importante ridurre il rumore nei dati e vuoi fornire dati di alta qualità da mettere a punto."
I dati devono essere ripuliti prima di essere passati all'AI, altrimenti le prestazioni del modello potrebbero peggiorare.
Varshney offre l'esempio di un ticket per call center con una soluzione non così ovvia: "Le persone potrebbero provare cinque modi diversi per risolverlo prima di trovare quello che funziona. Non si può inviare quel ticket direttamente al modello. Sarà molto rumoroso. Conterrà tutte le cose che la gente ha provato. Il modello potrebbe confondersi su quale sia il risultato corretto. Bisogna eliminare il rumore in modo che il modello veda solo la vera soluzione."
La pulizia, la preparazione e la cura dei set di dati richiedono un lavoro manuale da parte di data scientist e analisti, partner interni o esterni. Comprende anche strumenti quali:
Gli strumenti di gestione dati abilitati dall'AI possono convalidare automaticamente i dati, segnalare errori e convertirli nel formato corretto.
I generatori di dati sintetici possono aiutare a colmare i valori mancanti e a integrare gli asset con corpora più grandi.
Strumenti di pre-elaborazione e data engineering, come Apache Spark e la libreria Python di pandas.
Gli strumenti di osservabilità dei dati possono tracciare il flusso dei dati nel tempo, monitorare l'utilizzo e il data lineage e rilevare le anomalie.
A prescindere dai vantaggi competitivi che i dati proprietari possono apportare all'AI generativa, un vantaggio strategico duraturo deriva dall'impiego del giusto mix di tecnologia e processi aziendali.
"Il workflow in sé è ciò che conta", spiega Varshney. "Il modello è una merce e continueremo a sviluppare modelli sempre migliori. Quello che dobbiamo davvero trovare è la giusta combinazione chirurgica tra unire AI tradizionale, automazione e AI generativa in un workflow."
In altre parole, le organizzazioni non possono inserire nei loro processi l'AI generativa - anche se si tratta di un modello ben calibrato in base alle loro specifiche - e aspettarsi dei risultati. Piuttosto, devono valutare i loro processi e adattare i loro workflow ai modelli tanto quanto adattano i loro modelli ai loro workflow.
Considera la lavastoviglie.
"Quando abbiamo sviluppato la lavastoviglie, non ci aspettavamo che potesse stare in piedi e lavare i piatti come facciamo noi nel lavandino", afferma Varshney. "Abbiamo modificato il processo in modo che la lavastoviglie potesse davvero eccellere nel lavaggio. Abbiamo impostato il problema nel formato corretto. Dobbiamo fare lo stesso qui. Dobbiamo riorganizzare i processi e trovare la giusta combinazione tra AI tradizionale e AI generativa. È allora che si comincia a sbloccare il valore."
