My IBM

Accedi

Che cosa sono le Large Language Model Operations (LLMOps)?

19 Ottobre 2023

Che cosa sono le LLMOps?

LLMOps è l'acronimo di "Large Language Model Operations" e si riferisce alle pratiche e ai workflow specializzati che accelerano lo sviluppo, l'implementazione e la gestione dei modelli AI durante il loro intero ciclo di vita.

Le piattaforme LLMOps possono offrire una gestione più efficiente delle librerie, riducendo i costi operativi e consentendo al personale meno tecnico di completare le attività. Queste operazioni includono la pre-elaborazione dei dati, l'addestramento del modello linguistico, il monitoraggio, l'ottimizzazione e la distribuzione. Come per le Machine Learning Operations (MLOps), le LLMOps si basano su una collaborazione di data scientist, ingegneri DevOps e professionisti IT.

LLM come ChatGPT di OpenAI che utilizza GPT-4 e BERT di Google rappresentano una nuova e più avanzata classe di modelli di elaborazione del linguaggio naturale (NLP) in grado di rispondere rapidamente a domande in linguaggio naturale, fornire riassunti e seguire istruzioni complesse.

Una piattaforma LLMOps porta la data science e l'ingegneria del software in un ambiente collaborativo per l'esplorazione dei dati, il monitoraggio degli esperimenti in tempo reale, il prompt engineering e la gestione di modelli e pipeline. Le LLMOps automatizzano le attività operative e di monitoraggio del ciclo di vita del machine learning.

Le ultime notizie e insight sull'AI  

Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think.

Iscriviti oggi

LLMOps vs. MLOps

Poiché le LLMOps rientrano nell'ambito delle operazioni di machine learning, potrebbero essere trascurate o addirittura denominate "MLOps per LLM", ma le LLMOps dovrebbero essere considerate separatamente in quanto si concentrano specificamente sulla semplificazione dello sviluppo di LLM. Ecco due modi in cui i workflow e i requisiti del machine learning (ML) cambiano specificamente con gli LLM.

Risparmiosui costi: con regolazione degli iperparametri: nell'ML, la regolazione degli iperparametri si concentra spesso sul miglioramento dell'accuratezza o di altre metriche. Per gli LLM, la messa a punto diventa importante anche per ridurre i costi e i requisiti di potenza computazionale dell'addestramento e dell'inferenza. Ciò può essere fatto modificando le dimensioni dei batch. Poiché gli LLM possono iniziare con un foundation model e poi essere ottimizzati con nuovi dati per miglioramenti specifici del dominio, possono offrire prestazioni più elevate spendendo meno.
Metriche delle prestazioni: i modelli ML hanno spesso metriche delle prestazioni chiaramente definite e facili da calcolare, tra cui precisione, AUC e punteggio F1. Ma quando si valutano gli LLM, è necessaria una serie diversa di benchmark e punteggi standard, come il Bilingual Evaluation Understudy (BLEU) e il Recall-Oriented Understudy for Gisting Evaluation (ROUGE). Questi richiedono un'ulteriore considerazione durante l'implementazione.

LLMOps, inoltre, può fornire quelle che sono considerate funzionalità tipiche di MLOps:

Gestione dei dati
Processo di implementazione
Test e addestramento dei modelli
Monitoraggio e osservabilità
Sicurezza e supporto alla conformità

AI Academy

Ecco perché i foundation model rappresentano un cambio di paradigma per l'AI

Scopri una nuova classe di modelli AI flessibili e riutilizzabili che possono sbloccare nuove entrate, ridurre i costi e aumentare la produttività, consulta quindi la nostra guida per approfondire.

Vai all'episodio

Casi d’uso

Le LLMOps possono portare maggiore efficienza a un'ampia varietà di attività, tra cui:

Costruire un database vettoriale s per recuperare le informazioni contestualmente rilevanti.
Integrazione e distribuzione continue (CI/CD), in cui le pipeline CI/CD automatizzano il processo di sviluppo del modello e semplificano i test e l'implementazione. Strumenti come Jenkins GitLab CI/CD e GitHub Actions aiutano a gestire queste pipeline, garantendo un workflow fluido ed efficiente. Ciò consente aggiornamenti e rollback dei modelli senza soluzione di continuità, riducendo al minimo le interruzioni per gli utenti. Il controllo delle versioni dei modelli e l'integrazione di pratiche di test approfondite possono aiutare a individuare precocemente i problemi, garantendo che vengano implementati solo modelli con buone prestazioni.
Raccolta, preparazione e prompt engineering dei dati, provenienti da una sufficiente varietà di fonti, domini e linguaggi.
Etichettatura e annotazione dei dati con input umano per fornire un giudizio complesso e specifico del dominio.
Storage, organizzazione e controllo delle versioni dei dati, con soluzioni di database e storage adeguate per facilitare lo storage, il recupero e la gestione dei dati durante l'intero ciclo di vita dell'LLM.
Analisi esplorativa dei dati (EDA) per esplorare, preparare e condividere dati specifici per il ciclo di vita del modello di machine learning quando si creano set di dati, tabelle e visualizzazioni modificabili e condivisibili.
Messa a punto dei modelli per l'ottimizzazione di modelli per attività o domini specifici.
Inferenza dei modelli e model serving per gestire le specifiche di produzione dei test e del controllo qualità, come la frequenza di aggiornamento del modello e i tempi di richiesta di inferenza. Abilita gli endpoint del modello API REST utilizzando l'accelerazione GPU.
Revisione e governance dei modelli per tenere traccia delle versioni dei modelli e delle pipeline e gestirne l'intero ciclo di vita. In questo modo è possibile consentire la collaborazione tra i modelli di machine learning usando una piattaforma MLOps open source come MLflow.
Monitoraggio dei modelli, incluso il feedback umano sulle applicazioni LLM. Identifica potenziali attacchi dannosi, modella la deriva e identifica le potenziali aree di miglioramento.
Analytics, registrazione e test dei prompt.
Prompt engineering, con strumenti per consentire l'apprendimento contestuale piuttosto che la messa a punto utilizzando dati sensibili.

Esecuzione dei prompt per abilitare l'ottimizzazione del modello.
Creazione e output di testo in una gamma di funzioni. Gli LLM possono generare codice, inclusi script e automazione per l'infrastruttura operativa. Creano testo, ad esempio per documentare codici o processi, e traducono le lingue.

Vantaggi

I principali vantaggi delle LLMOps possono essere raggruppati in tre voci principali: efficienza, riduzione del rischio e scalabilità.

Efficienza

Le LLMOps consentono ai team di fare di più con meno in vari modi, a partire dalla collaborazione in team. Gli sforzi possono essere semplificati quando i data scientist, gli ingegneri dell'ML, DevOps e gli stakeholder sono in grado di collaborare più rapidamente su una piattaforma unificata per la comunicazione e la condivisione di insight, lo sviluppo e l'implementazione di modelli, il tutto con conseguente consegna più rapida.

I costi computazionali possono essere ridotti ottimizzando l'addestramento dei modelli, selezionando architetture adeguate e utilizzando tecniche tra cui il pruning e la quantizzazione dei modelli. Le LLMOps possono aiutare a garantire l'accesso a risorse hardware adeguate, come le GPU, per un'efficiente messa a punto, monitoraggio e ottimizzazione dell'utilizzo delle risorse. Inoltre, la gestione dei dati può essere semplificata quando le LLMOps promuovono solide pratiche di gestione dei dati, per garantire che i set di dati di alta qualità vengano reperiti, puliti e utilizzati per l'addestramento.

Gli iperparametri possono essere migliorati, compresi i tassi di apprendimento e le dimensioni dei batch per offrire prestazioni ottimali, mentre l'integrazione con DataOps può facilitare un flusso di dati fluido dall'inserimento all'implementazione del modello e consentire un processo decisionale basato sui dati.

I cicli di iterazione e feedback possono essere accelerati automatizzando le attività ripetitive e consentendo una rapida sperimentazione. Utilizzando la gestione dei modelli, le LLMOps possono semplificare i processi di modelli linguistici di grandi dimensioni dall'inizio alla fine, contribuendo a garantire che i modelli vengano creati, addestrati, valutati e distribuiti in modo ottimale.

Le prestazioni dei modelli possono essere migliorate utilizzando dati di addestramento di alta qualità e rilevanti per il dominio. Inoltre, durante il monitoraggio e l'aggiornamento costante dei modelli, le LLMOps possono garantire le massime prestazioni. Lo sviluppo di modelli e pipeline può essere accelerato per fornire modelli di qualità superiore e distribuire più rapidamente gli LLM in produzione.

Riduzione del rischio

È possibile migliorare la sicurezza e la privacy utilizzando LLMOps avanzate di livello aziendale per dare priorità alla protezione delle informazioni sensibili, aiutando a prevenire le vulnerabilità e gli accessi non autorizzati. La trasparenza e le risposte più rapide alle richieste normative contribuiscono a garantire una maggiore conformità con le politiche dell'organizzazione o del settore.

Scalabilità

Le LLMOps consentono una più semplice scalabilità e gestione dei dati, il che è fondamentale quando è necessario supervisionare, controllare, amministrare e monitorare migliaia di modelli per un'integrazione continua, una consegna continua e una distribuzione continua. Le LLMOps possono farlo migliorando la latenza del modello, che può essere ottimizzata per offrire un'esperienza utente più reattiva.

La scalabilità può essere semplificata con il monitoraggio dei modelli all'interno di un ambiente di integrazione, consegna e distribuzione continue. Le pipeline LLM possono incoraggiare la collaborazione, ridurre i conflitti e accelerare i cicli di rilascio. La riproducibilità delle pipeline LLM può consentire una collaborazione più strettamente accoppiata tra i team di dati, riducendo così i conflitti con DevOps e IT e accelerando la velocità di rilascio.

I workload possono essere gestiti senza problemi, anche se soggetti a fluttuazioni. Le LLMOps sono in grado di gestire grandi volumi di richieste contemporaneamente, il che è particolarmente vitale per le applicazioni aziendali.

Best practice

Per operazioni più fluide, ecco alcuni suggerimenti da tenere a mente.

Coinvolgimento della community: interagisci con la community open source per rimanere al corrente degli ultimi progressi e delle best practice. I cambiamenti avvengono rapidamente.

Gestione delle risorse computazionali: l'addestramento di LLM prevede calcoli approfonditi su set di dati di grandi dimensioni.Le GPU specializzate possono consentire operazioni più rapide e accelerare le operazioni parallele ai dati.

Monitoraggio e manutenzione continua del modello: gli strumenti di monitoraggio possono rilevare la deriva delle prestazioni del modello nel tempo. Utilizzando il feedback del mondo reale sugli output del modello è possibile perfezionare e riaddestrare il modello.

Gestione dei dati: Scegli un software adatto a gestire grandi volumi di dati, garantendo un recupero efficiente dei dati durante il ciclo di vita dell'LLM. Tieni traccia delle modifiche e dello sviluppo dei dati con il controllo delle versioni dei dati. Proteggi i dati con la crittografia del transito e i controlli degli accessi. Automatizza la raccolta, la pulizia e la pre-elaborazione dei dati per fornire un flusso costante di dati di alta qualità. Assicurati che i set di dati siano sottoposti a controllo delle versioni per garantire transizioni fluide tra le diverse versioni dei set di dati.

Preparazione dei dati e prompt engineering: trasforma, aggrega e deduplica i dati su base regolare. Assicurati che i dati siano visibili e condivisibili tra i team di dati.

Distribuzione: per essere più efficiente dal punto di vista dei costi, è possibile adattare un modello pre-addestrato per compiti specifici. Piattaforme come NVIDIA TensorRT e ONNX Runtime offrono strumenti di ottimizzazione del deep learning.

Disaster recovery e ridondanza: esegui regolarmente il backup di modelli, dati e configurazioni in caso di disastri. Con la ridondanza, è possibile gestire gli errori di sistema senza influire sulla disponibilità del modello.

Sviluppo di modelli etici: anticipa, scopri e correggi le distorsioni nei dati di addestramento e negli output del modello che possono distorcere gli output.

Feedback umano: l'apprendimento per rinforzo dal feedback umano (RLHF) può migliorare la formazione LLM. Poiché le attività LLM sono spesso aperte, il feedback dell'utente finale può essere critico per valutare le prestazioni LLM.
Catene o pipeline LLM: con l'aiuto di framework come LangChain o LlamaIndex, è possibile collegare più chiamate LLM o interazioni di sistemi esterni per consentire attività complesse come rispondere alle domande degli utenti.
Ottimizzazione del modello: utilizza librerie open source come DeepSpeed, Hugging Face Transformers, JAX, PyTorch e TensorFlow per migliorare le prestazioni del modello. L'ottimizzazione della latenza del modello è fondamentale per fornire un'esperienza utente reattiva.
Monitoraggio dei modelli: crea meccanismi di tracciamento del lineage del modello e della pipeline e le versioni per garantire una gestione efficiente del ciclo di vita degli artefatti e delle transizioni.

Addestramento dei modelli: utilizza l'addestramento distribuito per gestire l'enorme scala di dati e parametri negli LLM. Metti a punto regolarmente i modelli con nuovi dati per mantenerli aggiornati ed efficaci.
Sicurezza del modello: controlla spesso i modelli per verificare la presenza di vulnerabilità e conduci regolari audit e test di sicurezza.

Privacy e conformità: convalida l'aderenza delle operazioni a normative come GDPR e CCPA con controlli di conformità regolari. Con l'AI e gli LLM nelle notizie, ci sarà un controllo.

Prompt engineering: i modelli che seguono le istruzioni possono seguire suggerimenti e istruzioni complesse. L'impostazione corretta di questi modelli di prompt sarà critica per risposte accurate e affidabili e per ridurre la possibilità di allucinazioni da modello o di hacking dei prompt.

Come scegliere il giusto foundation model

Impara a scegliere l’approccio giusto nella preparazione dei set di dati e nell’impiego dei foundation model.

Soluzioni correlate

Foundation Model

Esplora la libreria IBM di foundation model nel portfolio di watsonx per scalare in sicurezza l'AI generativa per la tua azienda.

Scopri watsonx.ai

Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI

Consulenza e servizi sull'AI

Reinventa i workflow e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.

Esplora i servizi AI

Risorse

Scopri IBM Granite

Scopri IBM® Granite, la nostra famiglia di modelli AI aperti, performanti e affidabili, personalizzati per le aziende e ottimizzati per scalare le applicazioni AI. Esplora le opzioni relative a lingua, codice, serie temporali e guardrail.

Come scegliere il giusto foundation model

Scopri come scegliere il foundation model di AI più adatto al tuo caso d’uso.

Scopri la potenza degli LLM

Consulta gli articoli, i blog e i tutorial di IBM Developer per approfondire la tua conoscenza degli LLM.

La guida del CEO all'ottimizzazione dei modelli

Scopri come incoraggiare i team a migliorare sempre di più le prestazioni dei modelli e a superare la concorrenza utilizzando le tecniche e le infrastrutture AI più recenti.

Un approccio differenziato ai foundation model di AI

Esplora il valore dei foundation model di livello aziendale che forniscono fiducia, prestazioni e benefici convenienti per tutti i settori.

Sblocca la potenza dell'AI generativa + ML

Scopri come incorporare l’AI generativa, il machine learning e i foundation model nelle operazioni di business per migliorare le prestazioni.

AI in Action 2024

Abbiamo intervistato 2.000 organizzazioni in merito alle loro iniziative AI per scoprire cosa funziona, cosa non funziona e come puoi rimanere sempre aggiornato.

Fai il passo successivo

Esplora la libreria IBM dei foundation model nel portafoglio di IBM watsonx per scalare in sicurezza l'AI generativa per la tua azienda.

Esplora watsonx.ai

Esplora le soluzioni AI