Data di pubblicazione: 18 gennaio 2024
Autore: Jim Holdsworth
La deriva del modello fa riferimento al calo delle prestazioni del modello a causa delle modifiche ai dati o ai rapporti tra le variabili di input e output. La deriva del modello, nota anche come decadimento del modello, può avere un impatto negativo sulle prestazioni del modello, con conseguenti previsioni e processi decisionali errati.
Per rilevare e mitigare la deriva, le organizzazioni possono monitorare e gestire le prestazioni sulla piattaforma di dati e AI. All'inizio, le prestazioni del modello potrebbero essere in linea ma, se non adeguatamente monitorate nel tempo, anche il modello AI meglio addestrato e più imparziale può "deviare" rispetto ai suoi parametri originali e produrre risultati indesiderati una volta implementato.
Se l'addestramento di un modello AI non è allineato con i dati in entrata, questo non è in grado di interpretarli accuratamente o di utilizzarli in tempo reale per eseguire previsioni puntuali in modo affidabile. Se la deriva non viene rilevata e mitigata in tempi rapidi, può aumentare ulteriormente, con conseguente maggiore danno alle operazioni.
I modelli creati utilizzando dati storici possono diventare rapidamente statici. In molti casi, ci sono sempre nuovi punti dati come nuove variazioni, nuovi modelli, nuove tendenze, che i vecchi dati storici non sono in grado di catturare.
Scopri gli ostacoli all'adozione dell'AI, in particolare la mancanza di soluzioni di governance e gestione del rischio dell'AI.
Registrati per leggere la guida sui foundation model
Il mondo è in continua evoluzione quindi, con i dati in continua evoluzione, perché i modelli utilizzati siano in linea con il mondo, devono essere costantemente rivisti e aggiornati. Ecco tre tipi di deviazione del modello che devono essere affrontati, ciascuno con una causa diversa.
Il primo è la deriva del concetto, che si verifica in occasione di una modifica tra le variabili di input e la variabile di destinazione, in quel punto l'algoritmo inizia a fornire risposte errate perché le definizioni non sono più valide. Il cambiamento nelle variabili indipendenti può avere effetto su una serie di intervalli di tempo, che sono:
La deriva di concetto si ripresenta e scompare a intervalli regolari, come nel caso della stagionalità del comportamento di acquisto in risposta ai cambiamenti climatici. Nei Paesi dai climi invernali, le vendite di pale da neve e spazzaneve normalmente aumentano nel tardo autunno e all'inizio dell'inverno. Anche per le nevicate previste devono essere effettuati.della clientela.
Uno sviluppo improvviso può portare a nuovi modelli di acquisto. Un esempio potrebbe essere l'improvvisa pubblicità di un ChatGPT che ha provocato un aumento della domanda di prodotti hardware e software per l'AI e un aumento del valore delle azioni delle società legate all'AI. Un modello di previsione addestrato prima della pubblicazione di tali notizie non poteva prevedere i risultati successivi. Un altro esempio è l'arrivo della pandemia di Covid-19, che ha anche creato un improvviso cambiamento nei comportamenti: le vendite di giochi e di attrezzature per l'esercizio fisico sono aumentate, mentre ristoranti e hotel hanno subito una riduzione.della clientela.
Alcune derive si verificano gradualmente o a un ritmo previsto. Ad esempio, spammer e hacker negli anni hanno utilizzato una serie di strumenti e trucchi. Con il miglioramento dei software di protezione e dei filtri antispam, i malintenzionati hanno dovuto alzare il tiro. Qualsiasi AI progettata per fornire protezione per le interazioni digitali deve essere al passo con i tempi; un modello statico presto risulterà inutile.
Il secondo è la deriva dei dati, in cui la distribuzione dei dati sottostanti dei dati di input è cambiata. Nella vendita al dettaglio, la vendita di un prodotto potrebbe essere influenzata dall'immissione nel mercato di un altro nuovo prodotto o dal ritiro di un prodotto concorrente. Oppure, se inizialmente un sito Web viene adottato dai giovani ma poi viene accettato dalle persone più in là con l'età, il modello originale basato sui modelli di utilizzo degli utenti più giovani potrebbe non funzionare altrettanto bene con la base di utenti più in là con l'età.
Il terzo è una modifica dei dati a monte, che si verifica in caso di modifica alla pipeline dei dati. Ad esempio, i dati a monte potrebbero essere modificati in una valuta diversa, ad esempio USD e non euro, oppure misurazioni in miglia anziché chilometri o temperature in Fahrenheit anziché Celsius. Una modifica di questo tipo eliminerebbe un modello che non era stato creato per tenere conto del cambiamento nel modo in cui i dati sono stati contrassegnati.
Affinché le organizzazioni possano rilevare e aiutare a correggere la deriva del modello, è necessario considerare quanto segue.
L'accuratezza di un modello AIpuò peggiorare in pochi giornidall'implementazione in quanto i dati di produzione deviano dai dati di addestramento del modello. Ciò può portare a previsioni errate e a un'esposizione significativa al rischio. Le organizzazioni dovrebbero utilizzare strumenti di monitoraggio e un programma di AI in grado di rilevare automaticamente quando la precisione di un modello diminuisce (o si sposta) al di sotto di una soglia preimpostata. Questo programma utilizzato per rilevare la deriva del modello dovrebbe anche tenere traccia delle transazioni che hanno causato la deriva, consentendo loro di essere contrassegnate nuovamente e utilizzate per riqualificare il modello, ripristinando il suo potere predittivo durante il tempo di esecuzione.
Esistono due modi per misurare la deriva. Il primo è statistico e utilizza parametri statistici. Questo modo spesso è più facile da implementare in quanto la maggior parte delle metriche di solito sono già in uso all'interno dell'azienda. Il secondo è basato su modelli. Questo modo misura la somiglianza tra un punto o gruppi di punti rispetto alla linea di base di riferimento.
Le organizzazioni devono testare periodicamente i propri modelli AI durante l'intero ciclo di vita. Questo test idealmente include:
Secondo unostudio sull'impatto economico complessivo condotto da Forrester, "Costruendo, eseguendo e gestendo modelli in un ambiente unificato di dati e AI, le organizzazioni possono essere sicure che i modelli AI rimangano equi, spiegabili e conformi ovunque. Questo approccio end-to-end all'AI consente inoltre a un'organizzazione di individuare e correggere le derive e le distorsioni del modello e di gestire il rischio del modello quando questo è in produzione."
Una best practice consiste nel gestire tutti i modelli da una dashboard centrale. Unapproccio integratopuò aiutare un'organizzazione a monitorare costantemente le metriche e avvisare i team in caso di derive in termini di accuratezza e coerenza dei dati attraverso lo sviluppo, la convalida e l'implementazione. Una visione centralizzata e olistica può aiutare le organizzazioni ad abbattere i silos e a fornire maggiore trasparenza lungo l'intera data lineage.
Rileva gli scenari di derive e l'entità attraverso un modello AI che confronta i dati di produzione e addestramento e le previsioni di modelli in tempo reale. In questo modo è possibile individuare rapidamente le derive e intervenire subito. Questo rilevamento è iterativo, proprio come leoperazioni di apprendimento automatico(MLOps) che sono iterative.
L'analisibasata sul tempo è utile per vedere come si è evoluta la deriva e quando si è verificata. Ad esempio, se i controlli vengono eseguiti ogni settimana, questo mostrerà come si è evoluta la deriva giorno dopo giorno. L'analisi dei tempi può essere utile anche per determinare se la deriva è stata graduale o improvvisa.
Utilizza un nuovo set di dati di addestramento a cui sono stati aggiunti campioni più recenti e pertinenti. L'obiettivo è quello di far rientrare rapidamente e correttamente in produzione i tuoimodelli linguistici di grandi dimensioni (LLM). Se il nuovo addestramento del modello non risolve il problema, potrebbe essere necessario un nuovo modello.
Invece di addestrare un modello con i dati in batch, le organizzazioni possono esercitarsi nell'"apprendimento online" utilizzando i proprimodelli di apprendimento automatico (ML) aggiornati utilizzando i dati del mondo reale più recenti non appena disponibili.
Può sembrare che un modello subisca una deriva in quanto i dati utilizzati per addestrarlo sono significativamente diversi dai dati di produzione effettivi che verranno utilizzati. In un caso d'uso medico, se le scansioni ad alta risoluzione vengono utilizzate durante l'addestramento e sul campo sono disponibili solo scansioni a bassa risoluzione, i risultati allora non saranno corretti.
Accelera la creazione di workflow AI responsabili, trasparenti e spiegabili per i modelli di AI generativa e machine learning.
Traccia le prestazioni del modello. Ricevi avvisi quando si verificano deviazioni nell'accuratezza del modello e coerenza dei dati.
Ottieni un vantaggio competitivo con le strategie di governance dei dati.
Sblocca gli insight dei CDO e dei leader di data science per creare una strategia di dati affidabile che acceleri la crescita dei ricavi.
Sblocca prospettive di esperti su come la tua organizzazione può migliorare la qualità dei dati, le prestazioni dell'AI e la fiducia.