Home topics supervised learning Cosa è l'apprendimento supervisionato?
Applica l'apprendimento supervisionato con watsonx.ai Abbonati per ricevere gli aggiornamenti sull'AI
Illustrazione con collage di pittogrammi di nuvole, grafico a torta, pittogrammi grafici su quanto segue
Cosa è l'apprendimento supervisionato?

L'apprendimento supervisionato, noto anche come machine learning supervisionato, è una sottocategoria dimachine learningeintelligenza artificiale. È definito dall'uso di set di dati etichettati per addestrare algoritmi che classificano i dati o prevedono i risultati in modo accurato.

Man mano che i dati di input vengono immessi nel modello, questo regola i suoi pesi fino a quando il modello non viene adattato in modo appropriato, il che avviene come parte del processo di convalida incrociata. L'apprendimento supervisionato aiuta le organizzazioni a risolvere una serie di problemi reali su larga scala, come la classificazione dello spam in una cartella separata dalla posta in arrivo. Può essere utilizzato per costruire modelli di machine learning altamente accurati.

Perché la governance dell'AI è un imperativo aziendale per scalare l'AI aziendale

Scopri gli ostacoli all'adozione dell'AI, in particolare la mancanza di soluzioni di governance e gestione del rischio dell'AI.

Contenuti correlati

Registrati per il report IDC

Come funziona l'apprendimento supervisionato

L'apprendimento supervisionato utilizza un set di addestramento per insegnare ai modelli a produrre l'output desiderato. Questo set di dati di addestramento include input e output corretti, che consentono al modello di apprendere nel tempo. L'algoritmo misura la sua precisione attraverso la funzione di perdita, regolandosi fino a quando l'errore non è stato sufficientemente ridotto.

L'apprendimento supervisionato può essere suddiviso in due tipi di problemi durante il data mining: classificazione e regressione:

  • La classificazione utilizza un algoritmo per assegnare con precisione i dati dei test in categorie specifiche. Riconosce entità specifiche all'interno del set di dati e tenta di trarre alcune conclusioni su come tali entità devono essere etichettate o definite. Gli algoritmi di classificazione comuni sono classificatori lineari, macchine vettoriali di supporto (SVM), alberi decisionali, k-nearest neighbor e foresta casuale, descritti dettagliatamente di seguito.
  • La regressione viene utilizzata per comprendere la relazione tra variabili dipendenti e indipendenti. Viene utilizzata comunemente per elaborare proiezioni, ad esempio per i ricavi delle vendite per una determinata azienda.La regressione lineare, la regressione logistica e la regressione polinomiale sono algoritmi di regressione diffusi.
Algoritmi di apprendimento supervisionati

Vari algoritmi e tecniche di calcolo vengono utilizzati nei processi di machine learning supervisionato. Di seguito sono riportate brevi spiegazioni di alcuni dei metodi di apprendimento più comunemente utilizzati, di solito calcolati attraverso l'uso di programmi come R o Python:

  • Reti neurali:sfruttate principalmente per algoritmi di deep learning, lereti neuralielaborano i dati di addestramento di input imitando l'interconnessione del cervello umano attraverso strati di nodi. Ciascun nodo è costituito da input, pesi, distorsioni (o soglia) e output. Se il valore di output supera una determinata soglia, "innesca" o attiva il nodo, passando i dati al livello successivo della rete. Le reti neurali imparano questa funzione di mappatura attraverso l'apprendimento supervisionato, regolandosi in base alla funzione di perdita attraverso il processo di discesa del gradiente. Quando la funzione di costo è pari o prossima allo zero, puoi essere sicuro della precisione del modello.
  • Naive Bayes:Naive Bayes è un approccio di classificazione che adotta il principio dell'indipendenza condizionale di classe del teorema Bayes. Ciò significa che la presenza di una funzione non influisce sulla presenza di un'altra funzione nella probabilità di un determinato risultato e ogni predittore ha un effetto uguale su quel risultato. Esistono tre tipi di classificatori Naïve Bayes: Naïve Bayes multinomiale, Naïve Bayes Bernoulli e Naïve Bayes gaussiano. Questa tecnica viene utilizzata principalmente nella classificazione del testo, nell'identificazione dello spam e nei sistemi di raccomandazione.
  • Regressione lineare:la regressione lineare viene utilizzata per identificare la relazione tra una variabile dipendente e una o più variabili indipendenti ed è generalmente utilizzata per fare previsioni sui risultati futuri. Quando esiste una sola variabile indipendente e una variabile dipendente, questa prende il nome di regressione lineare semplice. Man mano che il numero di variabili indipendenti aumenta, viene definita regressione lineare multipla. Per ogni tipo di regressione lineare, cerca di tracciare una linea di stima migliore, che viene calcolata attraverso il metodo dei minimi quadrati. Tuttavia, a differenza di altri modelli di regressione, questa linea è diritta quando viene tracciata su un grafico.
  • Regressione logistica:se la regressione lineare viene sfruttata quando le variabili dipendenti sono continue, la regressione logistica viene selezionata quando la variabile dipendente è categorica, il che significa che hanno output binari, come "vero" e "falso" o "sì" e "no". Mentre entrambi i modelli di regressione cercano di comprendere le relazioni tra gli input di dati, la regressione logistica viene utilizzata principalmente per risolvere problemi di classificazione binaria, ad esempio l'identificazione dello spam.
  • Macchine vettoriali di supporto (SVM):una macchina vettoriale di supporto è un modello di apprendimento supervisionato comune sviluppato da Vladimir Vapnik, utilizzato sia per la classificazione dei dati, sia per la regressione. Detto questo, in genere viene sfruttato per problemi di classificazione, creando un iperpiano in cui la distanza tra due classi di punti dati è massima. Questo iperpiano è noto come limite decisionale e separa le classi di punti dati (ad es. arance e mele) su entrambi i lati del piano.
  • K-nearest neighbor: il K-nearest neighbor, noto anche come algoritmo KNN, è un algoritmo non parametrico che classifica i punti dati in base alla loro vicinanza e associazione con altri dati disponibili. Questo algoritmo presuppone che punti dati simili possano essere trovati uno vicino all'altro. Di conseguenza, cerca di calcolare la distanza tra i punti dati, solitamente attraverso la distanza euclidea, e quindi assegna una categoria in base alla categoria o alla media più frequente.La sua facilità d'uso e il basso tempo di calcolo lo rendono un algoritmo preferito dai data scientist ma, con l'aumentare del set di dati di test, il tempo di elaborazione si allunga, rendendolo meno interessante per le attività di classificazione. KNN viene in genere utilizzato per i motori di raccomandazione e il riconoscimento delle immagini.
  • Foresta casuale: la foresta casuale è un altro algoritmo di machine learning supervisionato flessibile, utilizzato per scopi di classificazione e regressione. La "foresta" fa riferimento a una raccolta di alberi decisionali non correlati, che vengono poi uniti per ridurre la varianza e creare previsioni di dati più precise.

 

Apprendimento non supervisionato, supervisionato e semi-supervisionato a confronto

Machine learning non supervisionatoe machine learning supervisionato vengono spesso discussi insieme. A differenza dell'apprendimento supervisionato, l'apprendimento non supervisionato utilizza dati non etichettati. Da questi dati, individua modelli che aiutano a risolvere i problemi di clustering o associazione. Ciò è particolarmente utile quando gli esperti del settore non sono sicuri delle proprietà comuni all'interno di un set di dati. Gli algoritmi di clustering più comuni sono i modelli gerarchici, k-medie e misti gaussiani.

L'apprendimento semi-supervisionato avviene quando solo una parte dei dati di input è stata etichettata. L'apprendimento non supervisionato e semi-supervisionato può essere un'alternativa più interessante, poiché può essere dispendioso in termini di tempo e di costi affidarsi all'esperienza di dominio per etichettare i dati in modo appropriato per l'apprendimento supervisionato.

Per un approfondimento delle differenze tra questi approcci, consulta "Apprendimento supervisionato e non supervisionato: qual è la differenza?"

esempi di apprendimento supervisionato

I modelli di apprendimento supervisionato possono essere utilizzati per creare e far avanzare una serie di applicazioni aziendali, tra cui:

  • Riconoscimento di immagini e oggetti: gli algoritmi di apprendimento supervisionato possono essere utilizzati per individuare, isolare e classificare oggetti da video o immagini, rendendoli utili se applicati a varie tecniche di computer vision e analisi delle immagini.
  • Analisi predittiva: un caso d'uso diffuso per i modelli di apprendimento supervisionato è la creazione di sistemi di analisi predittiva per fornire insight approfonditi su vari punti dati aziendali. Ciò consente alle aziende di anticipare determinati risultati in base a una data variabile di output, aiutando i leader aziendali a giustificare le decisioni o a cambiare rotta a vantaggio dell'organizzazione.
  • Analisi del sentiment del cliente: utilizzando algoritmi di machine learning supervisionati, le organizzazioni possono estrarre e classificare informazioni importanti da grandi volumi di dati inclusi contesto, emozioni e intenzioni, con un intervento umano minimo. Questo può essere incredibilmente utile per ottenere una migliore comprensione delle interazioni con i clienti e può essere utilizzato per migliorare gli sforzi di coinvolgimento del marchio.
  • Rilevamento dello spam: il rilevamento dello spam è un altro esempio di un modello di apprendimento supervisionato. Utilizzando algoritmi di classificazione supervisionati, le organizzazioni possono addestrare i database a riconoscere modelli o anomalie nei nuovi dati per organizzare in modo efficace le corrispondenze spam e non correlate allo spam.
Sfide dell'apprendimento supervisionato

Sebbene l'apprendimento supervisionato possa offrire alle aziende vantaggi, come insight approfonditi sui dati e una migliore automazione, ci sono alcune sfide quando si costruiscono modelli di apprendimento supervisionato sostenibili. Le seguenti sono alcune di queste sfide:

  • I modelli di apprendimento supervisionato possono richiedere determinati livelli di competenza per essere strutturati in modo accurato.
  • La formazione di modelli di apprendimento supervisionato può richiedere molto tempo.
  • I set di dati possono avere una maggiore probabilità di errore umano, con conseguente apprendimento errato degli algoritmi.
  • A differenza dei modelli di apprendimento non supervisionato, l'apprendimento supervisionato non può raggruppare o classificare i dati autonomamente.
Soluzioni correlate
IBM Watson Studio

Crea e scala un'IA attendibile su qualsiasi cloud. Automatizza il ciclo di vita dell'IA per ModelOps.

Esplora IBM Watson Studio
IBM Cloud Pak for Data

Connetti i dati giusti, al momento giusto, alle persone giuste ovunque.

Esplora Cloud Pak for Data
Soluzioni IBM Cloud

Ibrido.Aperto.Resiliente. Una piattaforma che è il tuo partner per la trasformazione digitale

Esplora le soluzioni cloud
Risorse Apprendimento pratico e gratuito per le tecnologie di AI generativa

Impara i concetti fondamentali dell'AI e dell'AI generativa, tra cui il prompt engineering, i modelli linguistici di grandi dimensioni e i migliori progetti open source.

Apprendimento supervisionato e non supervisionato: qual è la differenza?

In questo articolo, esploreremo le basi di due approcci di data science: supervisionato e non supervisionato.

Modelli di apprendimento supervisionato

Esplora alcuni approcci di apprendimento supervisionato come le macchine vettoriali di supporto e i classificatori probabilistici

Fai il passo successivo

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

Esplora watsonx.ai Prenota una demo live