AutoML
cloud leadspace
Che cos'è AutoML?

Scopri come AutoML può aiutarti a costruire soluzioni di intelligenza artificiale ripetibili e spiegabili.

L'apprendimento automatico automatizzato(AutoML)è diventato un argomento di tendenza nell'industria e nella ricerca accademica sull'intelligenza artificiale (AI) negli ultimi anni. AutoML rappresenta una grande promessa nel fornire soluzioni per l'intelligenza artificiale nelle industrie regolamentate, per garantire risultati spiegabili e riproducibili. AutoML permette un maggiore accesso allo sviluppo dell'intelligenza artificiale per coloro che non hanno il background teorico attualmente necessario per il ruolo in data science

Ogni fase nell'attuale pipeline di prototipi della data science, come la pre-elaborazione dei dati, l'ingegneria delle caratteristiche e l'ottimizzazione degli iperparametri, deve essere eseguita manualmente da esperti di apprendimento automatico. In confronto, l'adozione di AutoML permette un processo di sviluppo più semplice con cui poche righe di codice possono generare il codice necessario per iniziare a sviluppare un modello di apprendimento automatico. 

Si può pensare ad AutoML, indipendentemente dal fatto che crei classificatori o addestri regressioni, come a un concetto di ricerca generalizzato, con algoritmi di ricerca specializzati, per trovare le soluzioni ottimali per ogni elemento di componente della pipeline di ML. Nel creare un sistema che permette l'automazione di sole tre parti fondamentali dell'automazione, ingegneria delle caratteristiche, ottimizzazione degli iperparametri e ricerca dell'architettura neurale, AutoML promette un futuro in cui l'apprendimento automatico democratizzato è una realtà. 

Prodotti in evidenza

Watson Studio


Tipi di AutoML

In una pipeline di data science, ci sono molti passaggi che un team di data science deve compiere per creare un modello predittivo. Anche i team esperti di analisti scientifici dei dati e ingegneri di ML possono trarre vantaggio della maggiore velocità e trasparenza di AutoML. Un analista scientifico dei dati deve iniziare con un'ipotesi, raccogliere il corretto set di dati, provare qualche visualizzazione dei dati, progettare funzioni extra per sfruttare tutti i segnali disponibili, addestrare un modello con iperparametri (link esterno a IBM) e per l'apprendimento profondo all'avanguardia deve progettare l'architettura ottimale per una rete neurale profonda, si spera su una GPU, se disponibile.

 

Ingegneria delle caratteristiche automatizzata


Una caratteristica dei dati è una parte dei dati di input per un modello di apprendimento automatico e l'ingegneria delle caratteristiche si riferisce al processo di trasformazione in cui uno scienziato dei dati ricava nuove informazioni dai dati esistenti. L'ingegneria delle caratteristiche è uno dei processi chiave che aggiungono valore in un flusso di lavoro di ML e caratteristiche valide rappresentano la differenza tra un modello con prestazioni accettabili e un modello con prestazioni ottimali. Queste trasformazioni matematiche dei dati non elaborati vengono lette nel modello e fungono da fulcro del processo di apprendimento automatico. L'ingegneria automatizzata delle caratteristiche (PDF 1,7 MB) (AFE) (link esterno a IBM) è il processo di esplorazione dello spazio delle combinazioni possibili di funzioni in modo meccanicistico piuttosto che manuale.

L'ingegneria manuale delle caratteristiche è un'alchimia moderna che ha un grande costo in termini di tempo: la creazione di una singola caratteristica può spesso richiedere ore e il numero di caratteristiche richieste per un punteggio minimo di accuratezza, per non parlare di una base di accuratezza a livello di produzione, può essere di centinaia. Automatizzando l'esplorazione di uno spazio di caratteristiche, AutoML riduce il tempo che un team di data science dedica a questa fase da giorni a minuti.

Ridurre le ore di intervento manuale da parte di un data scientist non è l'unico vantaggio per l'ingegneria delle caratteristiche automatizzata. Le caratteristiche generate sono spesso chiaramente interpretabili. In settori strettamente regolamentati come l'assistenza sanitaria o la finanza, questa spiegabilità (link esterno a IBM) è importante perché abbassa le barriere all'adozione dell'intelligenza artificiale attraverso l'interpretabilità. Inoltre, un analista scientifico dei dati o un semplice analista trae vantaggio della chiarezza di queste caratteristiche perché rendono i modelli di alta qualità più convincenti e utilizzabili. Le caratteristiche generate automaticamente hanno anche il potenziale di trovare nuovi KPI da monitorare e su cui agire per un'organizzazione. Una volta che un analista scientifico dei dati ha completato l'ingegneria delle caratteristiche, deve ottimizzare i propri modelli con una selezione strategica delle caratteristiche.

 

Ottimizzazione automatica degli iperparametri


Gli iperparametri sono una parte degli algoritmi di apprendimento automatico meglio compresi per analogia come leve per ottimizzare le prestazioni del modello, anche se spesso le regolazioni incrementali hanno un impatto enorme. Nella modellazione di data science in piccola scala, gli iperparametri possono essere impostati manualmente e ottimizzati con facilità mediante prova ed errore.

Per le applicazioni di apprendimento profondo, il numero di iperparametri cresce in modo esponenziale, il che pone la loro ottimizzazione al di là delle capacità di un team di data science di realizzarla in modo manuale e tempestivo. L'ottimizzazione automatizzata degli iperparametri (HPO) (link esterno a IBM) solleva i team dalla grande responsabilità di esplorare e ottimizzare nell'intero spazio degli eventi per gli iperparametri e permette invece ai team di iterare e sperimentare su caratteristiche e modelli.

Un'altra complessità dell'automazione del processo di apprendimento automatico è che ora gli analisti scientifici dei dati possono concentrarsi sul perché della creazione del modello piuttosto che sul come.Considerando le quantità estremamente grandi di dati disponibili per molte aziende e il numero enorme di domande a cui si può rispondere con questi dati, un team di analisti può prestare attenzione a quali aspetti del modello devono essere ottimizzati, come il classico problema di ridurre i falsi negativi nei test medici.

NAS (Neural Architecture Search)


Il processo più complesso e che richiede più tempo nell'apprendimento profondo è la creazione dell'architettura neurale. I team di data science trascorrono molto tempo a selezionare i livelli appropriati e i tassi di apprendimento che alla fine sono spesso solo per i pesi nel modello, come in molti modelli linguistici. La ricerca dell'architettura neurale (NAS) (link esterno a IBM) è stata descritta come "utilizzo delle reti neurali per progettare le reti neurali" ed è una delle aree più ovvie di ML per trarre vantaggio dall'automazione.

Le ricerche NAS iniziano con una scelta su quali architetture tentare. Il risultato di NAS è determinato dalla metrica rispetto alla quale viene giudicata ciascuna architettura. Ci sono diversi algoritmi comuni da utilizzare in una ricerca di architettura neurale. Se il numero potenziale di architetture è piccolo, le scelte per la verifica possono essere casuali. Gli approcci basati sul gradiente, in cui lo spazio di ricerca discreto viene trasformato in una rappresentazione continua, hanno dimostrato di essere molto efficaci. I team di data science possono anche provare algoritmi evolutivi in cui le architetture vengono valutate a caso e le modifiche vengono applicate lentamente, propagando le architetture figlie che hanno più successo e riducendo quelle che non ne hanno.

Le ricerche sull'architettura neurale sono uno degli elementi chiave di AutoML che promettono di democratizzare l'intelligenza artificiale. Queste ricerche, però, spesso hanno un'impronta di carbonio molto alta. Un esame di questi compromessi non è ancora stata eseguita e l'ottimizzazione per il costo ecologico è un'area di ricerca in corso negli approcci NAS.

Link correlati

Data science

Machine Learning

AutoAI


Strategie per utilizzare AutoML

L'apprendimento automatico automatizzato rappresenta una panacea di soluzioni tecniche che un'organizzazione può utilizzare per sostituire i costosi data scientist, ma in realtà il suo utilizzo richiede strategie intelligenti per un'organizzazione. I data scientist ricoprono ruoli essenziali per progettare esperimenti, tradurre i risultati in risultati aziendali e mantenere l'intero ciclo di vita dei loro modelli di apprendimento automatico. Quindi, come possono i team interfunzionali fare uso di AutoML per ottimizzare l'uso del tempo e ridurre il tempo per realizzare valore dai loro modelli?

Il workflow ottimale per l'inclusione delle API di AutoML è quello che le utilizza per parallelizzare i carichi di lavoro e ridurre il tempo dedicato ad attività manuali intensive. Invece di dedicare giorni all'ottimizzazione degli iperparametri, un analista scientifico dei dati potrebbe invece automatizzare questo processo su più tipi di modelli contemporaneamente e poi successivamente testare quale modello ha le migliori prestazioni.  

Inoltre, ci sono funzioni AutoML che permettono ai membri del team di diversi livelli di competenze di contribuire alla pipeline di data science. Un analista scientifico dei dati senza esperienza in Python potrebbe utilizzare un kit di strumenti, come AutoAI su Watson Studio, per addestrare un modello predittivo utilizzando i dati che possono essere estratti autonomamente tramite query. Utilizzando AutoML, un analista di dati può ora preelaborare i dati, creare una pipeline di apprendimento automatico e produrre un modello completamente addestrato da utilizzare per convalidare le proprie ipotesi senza richiedere l'attenzione di un intero team di data science.


AutoML e IBM AutoAI

I ricercatori e gli sviluppatori IBM contribuiscono alla crescita e allo sviluppo di AutoML. Lo sviluppo continuo del prodotto con AutoAI su IBM Watson e il lavoro dei ricercatori IBM su Lale (link esterno a IBM), una libreria di data science automatizzata open-source, sono solo alcuni dei modi in cui IBM aiuta a creare la prossima generazione di approcci all'intelligenza artificiale. Sebbene Lale sia un progetto open source, in realtà è la funzionalità principale di molte delle funzionalità di AutoAI. 

Per i team di data science che lavorano con Python come nucleo del loro stack di ML, Lale offre una libreria semi-automatica che si integra perfettamente all'interno delle pipeline di scikit-learn (link esterno a IBM), diversa da auto-sklearn (link esterno a IBM) o una libreria come TPOT (link esterno a IBM). Lale va oltre scikit-learn con automazione, controlli di correttezza e interoperabilità. Pur essendo basato sul paradigma scikit-learn, ha un numero crescente di trasformatori e operatori da altre librerie Python e da librerie in linguaggi come Java e R. 

AutoAI fornisce tutti gli elementi dell'apprendimento automatico automatizzato descritto sopra e altro ancora. Le attuali funzionalità di Auto ML automatizzano solo una piccola parte dei carichi di lavoro dei data scientist e degli ingegneri di ML. Watson Studio e AutoAI permettono a un team di data science di automatizzare rapidamente l'intero ciclo di vita di AI/ML e di sperimentare per risolvere le sfide aziendali. I team possono ridurre il loro time-to-market con le loro capacità predittive partendo da una serie di prototipi per modelli di apprendimento automatico. AutoAI in Watson Studio semplifica l'ingegneria delle caratteristiche automatizzata, l'ottimizzazione degli iperparametri automatizzata e la selezione del modello di apprendimento automatico. I team di data scientist e analisti di dati possono valutare le loro ipotesi rapidamente e, nel momento in cui hanno certificato la validità dei loro modelli, possono già averli distribuiti per l'utilizzo in contesti di QA o di produzione. 

Se tu o il tuo team volete provare AutoML per pratiche avanzate di data science, possiamo collaborare con voi per le vostre iniziative più recenti di costruzione di modelli. Le organizzazioni hanno dimostrato il valore di una rapida prototipazione dei modelli di formazione, selezione e implementazione. Se hai appena iniziato, considera alcuni dei tutorial e casi d'uso su IBM Developer

Iscriviti per un account IBM Cloud dove puoi trovare Prototipazione rapida con AutoAI in Watson Studio con un piano Lite


Soluzioni correlate

AutoAI

AutoAI è una variazione dell'apprendimento automatico automatizzato (AutoML). Estende l'automazione della creazione del modello all'intero ciclo di vita di un modello di apprendimento automatico.