Cosa è l'apprendimento supervisionato?

Autori

Staff writer

Staff Editor, AI Models

IBM Think

Cosa è l'apprendimento supervisionato?

L'apprendimento supervisionato è una tecnica di machine learning che utilizza set di dati etichettati per addestrare modelli di intelligenza artificiale (AI) per identificare i pattern e le relazioni sottostanti. L'obiettivo del processo di apprendimento è quello di creare un modello in grado di prevedere output corretti su nuovi dati del mondo reale.

I dati etichettati sono costituiti da punti dati di esempio, accompagnati dalle risposte o dagli output corretti. Via via che i dati di input vengono immessi nell'algoritmo di machine learning, questo regola i propri pesi fino a quando il modello non viene adattato in modo adeguato. I dati di addestramento etichettati forniscono un "ground truth", o verità fondamentale, insegnando esplicitamente al modello a identificare le relazioni tra caratteristiche ed etichette di dati.

Il machine learning supervisionato aiuta le organizzazioni a risolvere una serie di problemi reali su larga scala, come la classificazione dello spam o la previsione dei prezzi delle azioni. Può essere utilizzato per costruire modelli di machine learning altamente accurati.

Cosa sono i dati di ground truth?

I dati di ground truth vengono verificati rispetto ai risultati del mondo reale, spesso tramite annotazioni o misurazioni umane, quindi vengono utilizzati per addestrare, convalidare e testare i modelli. Come suggerisce il nome, è stato confermato che i dati di ground truth sono veri, ovvero riflettono valori e risultati del mondo reale. Il ground truth riflette gli output ideali per qualsiasi dato di input.

L'apprendimento supervisionato si basa su dati di ground truth per insegnare a un modello le relazioni tra input e output. I set di dati etichettati utilizzati nell'apprendimento supervisionato sono dati di ground truth. I modelli addestrati applicano la loro comprensione di tali dati per fare previsioni basate su dati nuovi e invisibili.

Newsletter di settore

Le ultime tendenze in materia di AI, proposte da esperti

Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.

Come funziona l'apprendimento supervisionato

L'apprendimento supervisionato utilizza un set di dati di addestramento etichettati per comprendere le relazioni tra dati di input e output. I data scientist creano manualmente set di dati di addestramento contenenti dati di input insieme alle etichette corrispondenti. L'apprendimento supervisionato addestra il modello ad applicare gli output corretti ai nuovi dati di input in casi d'uso reali.

Durante l'addestramento, l'algoritmo del modello elabora grandi set di dati per esplorare le potenziali correlazioni tra input e output. Le prestazioni del modello vengono quindi valutate con i dati di test per scoprire se l'addestramento è stato eseguito correttamente. La convalida incrociata è il processo di test di un modello utilizzando una porzione diversa del set di dati.

Gli algoritmi della famiglia di discesa del gradiente, inclusa la discesa stocastica del gradiente (SGD), sono gli algoritmi di ottimizzazione, o algoritmi di apprendimento, più comunemente usati durante l'addestramento delle reti neurali e di altri modelli di machine learning. L'algoritmo di ottimizzazione del modello valuta l'accuratezza attraverso la funzione di perdita, ovvero un'equazione che misura la discrepanza tra le previsioni del modello e i valori effettivi.

La funzione di perdita misura la distanza tra le previsioni e i valori effettivi. Il suo gradiente indica la direzione in cui i parametri del modello devono essere regolati per ridurre l'errore. Durante l'addestramento, l'algoritmo di ottimizzazione aggiorna i parametri del modello (le sue regole operative o "impostazioni") per ottimizzare il modello.

Poiché i grandi set di dati contengono spesso molte caratteristiche, i data scientist possono semplificare questa complessità attraverso la riduzione della dimensionalità. Questa tecnica di data science riduce il numero di caratteristiche a quelle più cruciali per la previsione delle etichette dei dati, il che preserva la precisione e aumenta l'efficienza.

Un esempio di apprendimento supervisionato in azione

Quale esempio di apprendimento supervisionato, possiamo considerare un modello di classificazione delle immagini creato per riconoscere le immagini dei veicoli e per determinare il tipo di veicolo. Questo modello può alimentare i test CAPTCHA utilizzati da molti siti web per rilevare i bot di spam.

Per addestrare questo modello, i data scientist preparano un set di dati di addestramento etichettato contenente numerosi esempi di veicoli, insieme al tipo di veicolo corrispondente: auto, moto, camion, bicicletta ecc. L'algoritmo del modello tenta di identificare i modelli nei dati di addestramento che fanno sì che un input, ovvero le immagini del veicolo, riceva un output designato, ovvero il tipo di veicolo.

Le ipotesi del modello vengono misurate rispetto ai valori dei dati effettivi in un set di test per determinare se ha effettuato previsioni accurate. In caso contrario, il ciclo di addestramento continua fino a quando le prestazioni del modello non hanno raggiunto un livello di precisione soddisfacente. Il principio di generalizzazione si riferisce alla capacità di un modello di fare previsioni adeguate su nuovi dati dalla stessa distribuzione, utilizzandoli come dati di addestramento.

AI Academy

AI all'opera nell'ambito del servizio clienti

Scopri come l'AI generativa può offrire ai clienti un'esperienza più fluida e aumentare la produttività dell'organizzazione in queste tre aree chiave: self-service, agenti umani e operazioni di contact center.

Vai all'episodio

Tipi di apprendimento supervisionato

Le attività di apprendimento supervisionato possono essere suddivise sostanzialmente in problemi di classificazione e regressione:

Classificazione

La classificazione nel machine learning utilizza un algoritmo per ordinare i dati in categorie. Riconosce entità specifiche all'interno del set di dati e tenta di stabilire come tali entità dovrebbero essere etichettate o definite. Gli algoritmi di classificazione più comuni sono i classificatori lineari, le macchine vettoriali di supporto (SVM), gli alberi decisionali, il k-nearest neighbor (KNN), la regressione logistica e la foresta casuale.

Le reti neurali eccellono nella gestione di problemi di classificazione complessi. Una rete neurale è un'architettura di deep learning che elabora i dati di addestramento con strati di nodi che imitano il cervello umano. Ciascun nodo è costituito da input, pesi, un bias (soglia) e un output. Se un valore di output supera una soglia preimpostata, il nodo si "innesca" o attiva, passando i dati al livello successivo della rete.

Regressione

La regressione viene utilizzata per comprendere la relazione tra variabili dipendenti e indipendenti. Nei problemi di regressione, l'output è un valore continuo e i modelli tentano di prevedere l'output target. Le attività di regressione includono proiezioni sui ricavi delle vendite o sulla pianificazione finanziaria.

Negli algoritmi di regressione, la regressione lineare, la regressione lasso, la regressione ridge e la regressione polinomiale sono esempi di algoritmi di regressione.

Apprendimento d'insieme

L'apprendimento d'insieme è un meta-approccio all'apprendimento supervisionato in cui più modelli vengono addestrati sullo stesso compito di classificazione o regressione. I risultati di tutti i modelli del pool vengono aggregati per scoprire il miglior approccio complessivo per risolvere il problema.

I singoli algoritmi all'interno del modello d'insieme più ampio sono noti come weak learner o modelli di base. Alcuni weak learner hanno pregiudizi elevati, mentre altri hanno una varianza elevata. In teoria, i risultati attenuano il compromesso tra bias e varianza combinando le parti migliori di ciascuno.

Algoritmi di apprendimento supervisionato

Gli algoritmi di ottimizzazione come la discesa del gradiente addestrano un'ampia gamma di algoritmi di machine learning che eccellono nelle attività di apprendimento supervisionato.

Naive Bayes: Naive Bayes è un algoritmo di classificazione che adotta il principio dell'indipendenza condizionale di classe dal teorema di Bayes. Ciò significa che la presenza di una caratteristica non influisce sulla presenza di un'altra nella probabilità di un determinato risultato e che ogni predittore ha un effetto uguale su quel risultato.

I classificatori Naive Bayes includono Multinomial, Bernoulli e Gaussian Naive Bayes. Questa tecnica viene spesso utilizzata nella classificazione dei testi, nell'identificazione dello spam e nei sistemi di raccomandazione.

Regressione lineare: la regressione lineare è utilizzata per identificare la relazione tra una variabile dipendente continua e una o più variabili indipendenti. In genere è utilizzata per fare previsioni sui risultati futuri.

La regressione lineare esprime la relazione tra le variabili come una linea retta. Quando si hanno una sola variabile indipendente e una sola variabile dipendente, si parla di regressione lineare semplice. Con l'aumentare del numero di variabili indipendenti, la tecnica viene definita regressione lineare multipla.

Regressione non lineare: a volte, un output non può essere riprodotto da input lineari. In questi casi, gli output devono essere modellati con una funzione non lineare. La regressione non lineare esprime una relazione tra variabili attraverso una linea non lineare o curva. I modelli non lineari possono gestire relazioni complesse con molti parametri.

Regressione logistica: la regressione logistica gestisce le variabili dipendenti categoriche, ovvero quando hanno output binari, come vero o falso o positivo o negativo. Mentre i modelli di regressione lineare e logistica cercano di comprendere le relazioni tra gli input di dati, la regressione logistica viene utilizzata principalmente per risolvere problemi di classificazione binaria, come l'identificazione dello spam.

Regressione polinomiale: simile ad altri modelli di regressione, la regressione polinomiale modella una relazione tra variabili su un grafico. Le funzioni utilizzate nella regressione polinomiale esprimono questa relazione attraverso un grado esponenziale. La regressione polinomiale è un caso speciale di regressione in cui le caratteristiche di input vengono elevate a potenze, consentendo ai modelli lineari di adattarsi a modelli non lineari.

Macchine a vettori di supporto (SVM): una macchina a vettori di supporto viene utilizzata sia per la classificazione che per la regressione dei dati. Solitamente gestisce tuttavia i problemi di classificazione. In questo caso, la SVM separa le classi di punti dati con un limite di decisione o un iperpiano. L'obiettivo dell'algoritmo SVM è quello di tracciare l'iperpiano che massimizza la distanza tra i gruppi di punti dati.

K-nearest neighbor: il K-nearest neighbor (KNN) è un algoritmo non parametrico che classifica i punti dati in base alla loro vicinanza e all'associazione con altri dati disponibili. Questo algoritmo presuppone che punti dati simili possano essere trovati uno vicino all'altro quando tracciati matematicamente.

La sua facilità d'uso e il basso tempo di calcolo lo rendono efficiente se utilizzato per i motori di raccomandazione e il riconoscimento delle immagini. Tuttavia, via via che il set di dati di test cresce, il tempo di elaborazione si allunga, rendendolo meno interessante per le attività di classificazione.

Foresta casuale: la foresta casuale è un algoritmo di machine learning supervisionato flessibile, utilizzato per scopi di classificazione e regressione. La "foresta" fa riferimento a una raccolta di alberi decisionali non correlati che vengono uniti per ridurre la varianza e aumentare la precisione.

Apprendimento supervisionato e altri metodi di apprendimento a confronto

L'apprendimento supervisionato non è l'unico metodo di apprendimento per l'addestramento di modelli di machine learning. Altri tipi di machine learning includono:

Apprendimento non supervisionato

Apprendimento semi-supervisionato

Apprendimento auto-supervisionato

Apprendimento per rinforzo

Apprendimento supervisionato e non supervisionato

La differenza tra l'apprendimento supervisionato e apprendimento non supervisionato è che il machine learning non supervisionato utilizza dati non etichettati senza alcuna verità oggettiva di base. Si lascia che il modello scopra autonomamente schemi e relazioni nei dati. Molti modelli di AI generativa vengono inizialmente addestrati con l'apprendimento non supervisionato e, successivamente, con l'apprendimento supervisionato per aumentarne le competenze di dominio.

L'apprendimento non supervisionato può aiutare a risolvere problemi di clustering o associazione in cui le proprietà comuni all'interno di un set di dati sono incerte. Gli algoritmi di clustering più comuni sono i modelli gerarchici, K-means e Gaussian Mixture.

Vantaggi dell'apprendimento non supervisionato

Analisi esplorativa: l' apprendimento non supervisionato è utile quando "cosa cercare" non è noto. È in grado di trovare strutture nascoste o anomalie nei dati che gli esseri umani potrebbero non aspettarsi.
Nessuna etichettatura dei dati: la maggior parte dei dati del mondo reale non è etichettata e l'etichettatura dei dati richiede molto tempo e impegno.
Flessibilità: i modelli di apprendimento non supervisionato possono adattarsi rapidamente ai nuovi dati grazie alla loro capacità di elaborare i dati in modo autonomo.
Scalabilità: senza la necessità di etichette di ground truth, le tecniche di apprendimento non supervisionato sono facilmente scalabili fino a enormi set di dati.

Svantaggi dell'apprendimento non supervisionato

Risultati imprecisi: senza il fondamento del ground truth, non è subito chiaro se un modello di apprendimento non supervisionato sia stato addestrato correttamente.
Sensibilità: set di dati rumorosi possono influire negativamente sui risultati dell'addestramento. Il feature engineering può aiutare a normalizzare i set di dati per un apprendimento non supervisionato più fluido.
Affidabilità dei dati: tutto l'addestramento richiede dati validi. Tuttavia, senza una verità oggettiva di base, distorsioni o altri errori nei dati possono dare origine a modelli che rafforzano tali incomprensioni.

Apprendimento supervisionato e semi-supervisionato a confronto

L'apprendimento semi-supervisionato prevede l'addestramento di un modello su una piccola porzione di dati di input etichettati, insieme a una porzione maggiore di dati senza etichetta. Poiché affidarsi all'esperienza del settore per etichettare i dati in modo corretto per l'apprendimento supervisionato può richiedere molto tempo e denaro, l'apprendimento semi-supervisionato può essere un'alternativa interessante.

Vantaggi dell'apprendimento semi-supervisionato

Minore dipendenza dalle etichette: rispetto all'apprendimento supervisionato, l'apprendimento semi-supervisionato richiede meno etichettatura, il che riduce le barriere all'ingresso per l'addestramento sui modelli.
Rilevamento di pattern nascosti: come l'apprendimento non supervisionato, l'uso di dati non etichettati nell'apprendimento semi-supervisionato può portare alla scoperta di modelli, relazioni e anomalie che altrimenti potrebbero passare inosservati.
Maggiore flessibilità: l'apprendimento semi-supervisionato crea una base attraverso i dati di ground truth, quindi li aumenta con set di dati senza etichetta per rendere i modelli più generalizzabili.

Svantaggi dell'apprendimento semi-supervisionato

Sensibilità al rumore: set di dati senza etichetta con alti gradi di rumore possono compromettere i risultati dell'addestramento, indebolendo le prestazioni del modello.
Sensibilità ai bias: se i set di dati non etichettati non vengono sottoposti a screening per i bias impliciti, tali bias possono essere trasferiti ai modelli sottoposti ad addestramento.
Maggiore complessità: riunire dati etichettati e non etichettati in un unico processo di addestramento può comportare tecniche di elaborazione dei dati complesse o richiedere più risorse.

Apprendimento supervisionato e auto-supervisionato a confronto

L'apprendimento auto-supervisionato (SSL) è spesso descritto come un ponte tra apprendimento supervisionato e non supervisionato. Anziché utilizzare le etichette dei set di dati di apprendimento supervisionato create manualmente, le attività SSL sono configurate in modo che il modello possa generare i propri segnali di supervisione (impliciti o pseudo-etichette) e distinguere il ground truth dai dati non strutturati. Quindi, la funzione di perdita del modello utilizza tali etichette al posto delle etichette effettive per valutare le prestazioni del modello.

SSL viene spesso utilizzato con il transfer learning, un processo in cui un modello pre-addestrato viene applicato a un'attività a valle. L'apprendimento auto-supervisionato vede un uso diffuso nelle attività di computer vision e di elaborazione del linguaggio naturale (NLP) che richiedono grandi set di dati che sono estremamente costosi e richiedono molto tempo per l'etichettatura.

Vantaggi dell'apprendimento auto-supervisionato

Efficienza: anziché chiedere ai data scientist di etichettare i punti dati, SSL automatizza il processo di etichettatura trasferendo l'attività sul modello.
Scalabilità: la minore dipendenza di SSL dall'etichettatura manuale dei dati lo presta bene alla scalabilità con pool più ampi di dati non etichettati.
Bassa dipendenza dall'etichettatura: nei casi in cui i dati di ground truth etichettati sono pochi, SSL compensa la carenza attraverso la comprensione generata dal modello.
Versatilità: i modelli con supervisione automatica apprendono caratteristiche ricche e trasferibili che possono essere ottimizzate per molte attività multimodali e specifiche del dominio.

Svantaggi dell'apprendimento auto-supervisionato

Elaborazione intensiva: elaborazione di set di dati non etichettati e la generazione di etichette richiedono molta potenza di calcolo.
Complessità: il processo di creazione di compiti pretestuali per l'apprendimento supervisionato, ovvero la fase iniziale di apprendimento, richiede un elevato grado di competenza.
Potenziale inaffidabilità: come qualsiasi tecnica di apprendimento che rimuova la supervisione umana, i risultati dipendono dal fatto che i dati siano privi di rumore eccessivo, pregiudizi impliciti e altri fattori che possono influire negativamente sulla comprensione del modello.

Apprendimento supervisionato e per rinforzo a confronto

L'apprendimento per rinforzo addestra agenti autonomi, come robot e auto a guida autonoma, a prendere decisioni attraverso interazioni ambientali. L'apprendimento per rinforzo non utilizza dati etichettati e si differenzia anche dall'apprendimento non supervisionato, in quanto insegna per tentativi ed errori e per ricompensa, non identificando i modelli sottostanti all'interno dei set di dati.

Vantaggi dell'apprendimento per rinforzo

Risoluzione di compiti complessi: il processo di addestramento per tentativi ed errori può portare un modello a capire come affrontare sfide strategiche complesse.
Indipendenza dall'etichettatura: i modelli apprendono in modo esperienziale, non teorico, attraverso l'abbinamento di input e output.
Autocorrezione: i modelli affinano il proprio comportamento quando sbagliano le cose durante l'addestramento.
Adattabilità: i modelli possono adattarsi a nuove informazioni e a circostanze mutevoli, in cui i risultati non sono predefiniti.

Svantaggi dell'apprendimento per rinforzo

Possibili risultati incoerenti: l'apprendimento per tentativi ed errori può sembrare casuale e imprevedibile, soprattutto quando si avvia l'addestramento per la prima volta.
Esigenze in materia di dati ambientali: l'apprendimento per rinforzo prevede che i modelli imparino dalle conseguenze delle loro azioni, il che a sua volta richiede grandi quantità di dati ambientali. Tuttavia, gli agenti possono apprendere anche in ambienti simulati.
Hacking delle ricompense: i modelli possono utilizzare le lacune nell'algoritmo di ricompensa per generare ricompense senza svolgere adeguatamente i loro compiti.
Compito specifico: l'apprendimento per rinforzo eccelle nei modelli di addestramento per una funzione specifica. Questi modelli possono avere difficoltà a trasferire a nuove attività ciò che hanno appreso.

Casi d'uso reali dell'apprendimento supervisionato

I modelli di apprendimento supervisionato possono creare e fare avanzare applicazioni aziendali tra cui:

Riconoscimento di immagini e oggetti: gli algoritmi di apprendimento supervisionato possono essere utilizzati per individuare, isolare e classificare oggetti da video o immagini, rendendoli utili con tecniche di computer vision e attività di analisi delle immagini.

Analytics predittiva: modelli di apprendimento supervisionati creano sistemi di analytics predittiva per fornire insight. Ciò consente alle aziende di anticipare i risultati in base a una variabile di output e prendere decisioni basate sui dati, aiutando quindi i leader aziendali che devono giustificare le proprie scelte o devono cambiare rotta a beneficio dell'organizzazione.

La regressione consente anche agli operatori sanitari di prevedere gli esiti in base ai criteri dei pazienti e ai dati storici. Un modello predittivo potrebbe valutare il rischio di un paziente per una specifica malattia o condizione, in base ai dati biologici e allo stile di vita.

Analisi del sentiment del cliente: le organizzazioni possono estrarre e classificare informazioni importanti da grandi volumi di dati inclusi contesto, emozioni e intenzioni, con un intervento umano minimo. L'analisi del sentiment offre una migliore comprensione delle interazioni con i clienti e può essere utilizzata per migliorare gli sforzi di coinvolgimento del brand.

Segmentazione dei clienti: i modelli di regressione possono prevedere il comportamento dei clienti in base a vari tratti e tendenze storiche. Le aziende possono utilizzare modelli predittivi per segmentare la propria base di clienti e delineare profili dei clienti al fine di migliorare le iniziative di marketing e sviluppo del prodotto.

Rilevamento dello spam: il rilevamento dello spam è un altro esempio di modello di apprendimento supervisionato. Utilizzando algoritmi di classificazione supervisionati, le organizzazioni possono addestrare i database a riconoscere modelli o anomalie nei nuovi dati per organizzare in modo efficace le corrispondenze spam e non-spam.

Forecasting: i modelli regressivi eccellono nel forecasting basato sulle tendenze storiche, il che li rende adatti all'uso nei settori finanziari. Le aziende possono anche utilizzare la regressione per prevedere le esigenze di inventario, stimare gli stipendi dei dipendenti ed evitare potenziali rallentamenti nella supply chain.

Motori di raccomandazione: grazie ai modelli di apprendimento supervisionato, i provider di contenuti e i marketplace online possono analizzare le scelte, le preferenze e gli acquisti dei clienti e creare motori di raccomandazione che forniscono consigli personalizzati, con maggiori probabilità di conversione.

Sfide dell'apprendimento supervisionato

Sebbene l'apprendimento supervisionato possa offrire alle aziende vantaggi come insight approfonditi sui dati e una migliore automazione, questa potrebbe non essere la scelta migliore per tutte le situazioni.

Limitazioni del personale: i modelli di apprendimento supervisionato possono richiedere determinati livelli di competenza per essere strutturati in modo accurato.

Coinvolgimento umano: i modelli di apprendimento supervisionato non sono in grado di apprendere autonomamente. I data scientist devono convalidare l'output delle prestazioni dei modelli.

Requisiti di tempo: i set di dati di addestramento sono grandi e devono essere etichettati manualmente, il che rende il processo di apprendimento supervisionato dispendioso in termini di tempo.

Inflessibilità: i modelli di apprendimento supervisionato faticano a etichettare i dati al di fuori dei limiti dei loro set di dati di addestramento. Un modello di apprendimento non supervisionato potrebbe essere maggiormente in grado di gestire nuovi dati.

Bias: i set di dati corrono il rischio di una maggiore probabilità di errore umano e bias, con conseguente apprendimento errato degli algoritmi. I bias possono derivare da set di dati di addestramento non bilanciati, pratiche di annotazione scadenti o disuguaglianze storiche riflesse nei dati.

Overfitting: l'apprendimento supervisionato a volte può comportare un overfitting, ovvero quando un modello diventa troppo adattato al suo set di dati. Un'elevata precisione nell'addestramento può indicare un overfitting rispetto a prestazioni generalmente elevate. Per evitare l'overfitting è necessario che i modelli siano testati con dati diversi da quelli di addestramento.

Sblocca la potenza dell'AI generativa + ML

Scopri come incorporare in tutta sicurezza l'AI generativa e il machine learning nella tua azienda.

Cosa è l'apprendimento supervisionato?

Autori

Cosa è l'apprendimento supervisionato?

Cosa sono i dati di ground truth?

Le ultime tendenze in materia di AI, proposte da esperti

Grazie per aver effettuato l'iscrizione!

Come funziona l'apprendimento supervisionato

Un esempio di apprendimento supervisionato in azione

AI all'opera nell'ambito del servizio clienti

Tipi di apprendimento supervisionato

Classificazione

Regressione

Apprendimento d'insieme

Algoritmi di apprendimento supervisionato

Apprendimento supervisionato e altri metodi di apprendimento a confronto

Apprendimento supervisionato e non supervisionato

Vantaggi dell'apprendimento non supervisionato

Svantaggi dell'apprendimento non supervisionato

Apprendimento supervisionato e semi-supervisionato a confronto

Vantaggi dell'apprendimento semi-supervisionato

Svantaggi dell'apprendimento semi-supervisionato

Apprendimento supervisionato e auto-supervisionato a confronto

Vantaggi dell'apprendimento auto-supervisionato

Svantaggi dell'apprendimento auto-supervisionato

Apprendimento supervisionato e per rinforzo a confronto

Vantaggi dell'apprendimento per rinforzo

Svantaggi dell'apprendimento per rinforzo

Casi d'uso reali dell'apprendimento supervisionato

Sfide dell'apprendimento supervisionato

Risorse