Il mondo diventa ogni giorno "più smart" e, per stare al passo con le aspettative dei consumatori, le aziende utilizzano sempre più algoritmi di machine learning per semplificare le cose. Può vederli in uso nei dispositivi degli utenti finali (tramite il riconoscimento facciale per sbloccare gli smartphone) o per rilevare frodi con carta di credito (come attivare avvisi per acquisti insoliti).
Nell'ambito dell'intelligenza artificiale (AI) e del machine learning, ci sono due approcci di base: apprendimento supervisionato e apprendimento non supervisionato. La differenza principale è che uno utilizza dati etichettati per aiutare a prevedere i risultati, mentre l'altro no. Tuttavia, ci sono alcune sfumature tra i due approcci e aree chiave in cui uno supera l'altro. Questo post chiarisce le differenze in modo da poter scegliere l'approccio migliore per la sua situazione.
Newsletter di settore
Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.
L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.
L'apprendimento supervisionato è un approccio di machine learning definito dall'uso di set di dati etichettati. Questi set di dati sono progettati per addestrare o "supervisionare" gli algoritmi affinché classifichino i dati o prevedano i risultati in modo accurato. Utilizzando input e output etichettati, il modello può misurarne la precisione e apprendere nel tempo.
L'apprendimento supervisionato può essere suddiviso in due tipi di problemi durante il data mining: classificazione e regressione.
L'apprendimento non supervisionato utilizza algoritmi di machine learning per analizzare e raggruppare set di dati non etichettati. Questi algoritmi scoprono schemi nascosti nei dati che non hanno bisogno dell'intervento umano (quindi, sono "non supervisionati").
I modelli di apprendimento non supervisionato vengono utilizzati per tre compiti principali: cluster, associazione e riduzione della dimensionalità.
La principale distinzione tra i due approcci è l'uso di set di dati etichettati. In parole povere, l'apprendimento supervisionato utilizza dati di input e output etichettati, mentre un algoritmo di apprendimento non supervisionato no.
Nell'apprendimento supervisionato, l'algoritmo "impara" dal set di dati di addestramento facendo previsioni sui dati in modo iterativo e aggiustando la risposta corretta. Sebbene i modelli di apprendimento supervisionato siano solitamente più accurati dei modelli di apprendimento non supervisionato, richiedono un intervento umano iniziale per etichettare i dati in modo adeguato. Ad esempio, un modello di apprendimento supervisionato può prevedere la durata del tuo tragitto giornaliero in base all'ora del giorno, alle condizioni meteorologiche e così via. Ma prima bisogna addestrarlo a capire che la pioggia prolunga i tempi di guida.
I modelli di apprendimento non supervisionato, invece, lavorano da soli per scoprire la struttura intrinseca dei dati non etichettati. Ricorda che richiedono comunque un intervento umano per convalidare le variabili di output. Ad esempio, un modello di apprendimento non supervisionato può identificare che gli acquirenti online acquistano spesso gruppi di prodotti contemporaneamente. Tuttavia, un analista di dati dovrebbe convalidare che è logico che un motore di raccomandazioni raggruppi i vestiti per bambini con un ordine di pannolini, omogeneizzato e bicchierini con beccuccio.
La scelta dell'approccio giusto per la tua situazione dipende dal modo in cui i tuoi data scientist valutano la struttura e il volume dei tuoi dati, nonché dal caso d'uso. Per prendere una decisione, assicurati di fare quanto segue:
Classificare i big data può essere una vera e propria sfida nell'apprendimento supervisionato, ma i risultati sono estremamente accurati e affidabili. L'apprendimento non supervisionato, invece, può gestire grandi volumi di dati in tempo reale, ma manca di trasparenza nel modo in cui i dati vengono raggruppati e aumenta il rischio di risultati inaccurati. È qui che entra in gioco l'apprendimento semi-supervisionato.
Non riesce a decidere se utilizzare l'apprendimento supervisionato o non supervisionato? L'apprendimento semi-supervisionato è la via di mezzo ideale, in cui si utilizza un set di dati di addestramento con dati etichettati e non etichettati. È particolarmente utile quando è difficile estrarre le caratteristiche rilevanti e quando si dispone di un volume elevato di dati.
L'apprendimento semi-supervisionato è ideale per le immagini mediche, in cui una piccola quantità di dati di addestramento può portare a un notevole miglioramento dell'accuratezza. Ad esempio, un radiologo può etichettare un piccolo sottoinsieme di scansioni TC per tumori o malattie, in modo che la macchina possa prevedere con maggiore precisione quali pazienti potrebbero richiedere più cure mediche.
I modelli di machine learning sono un modo efficace per ottenere insight sui dati che migliorano il nostro mondo. Per maggiori informazioni sugli algoritmi specifici utilizzati con l'apprendimento supervisionato e non supervisionato, ti invitiamo ad approfondire gli articoli di Learn Hub su queste tecniche. Ti consigliamo anche di dare un'occhiata al post sul blog che fa un ulteriore passo avanti, con uno sguardo dettagliato al deep learning e alle reti neurali.
Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e con una minima quantità di dati.
Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.
Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.