My IBM Accedi Iscriviti

Cinque tipi di machine learning da conoscere

20 dicembre 2023

5 min di lettura

Autore

Chrystal R. China

Writer, automation & ITOps

Le tecnologie di machine learning (ML) possono guidare il processo decisionale in quasi tutti i settori, dall'assistenza sanitaria alle risorse umane fino alla finanza, e in innumerevoli casi d'uso, come la computer vision, i modelli linguistici di grandi dimensioni (LLM), il riconoscimento vocale, le auto a guida autonoma e altro ancora.

Tuttavia, l'influenza crescente dell'ML non è senza complicazioni. I set di dati di convalida e addestramento che sono alla base della tecnologia ML sono spesso aggregati da esseri umani e gli esseri umani sono suscettibili di pregiudizi e inclini all'errore. Anche nei casi in cui un modello di ML non è di per sé distorto o difettoso, la distribuzione nel contesto sbagliato può produrre errori con conseguenze dannose non intenzionali.

Ecco perché la diversificazione dell'uso di AI e ML in azienda può rivelarsi preziosa per mantenere un vantaggio competitivo. Ogni tipo e sottotipo di algoritmo di ML presenta benefici e funzionalità unici che i team possono utilizzare per attività diverse. Qui discuteremo i cinque tipi principali e le loro applicazioni.

Che cos'è il machine learning?

L'ML è un sottoinsieme di informatica, data science e intelligenza artificiale (AI) che consente ai sistemi di apprendere e migliorare dai dati senza ulteriori interventi di programmazione.

Invece di utilizzare istruzioni esplicite per l'ottimizzazione delle prestazioni, i modelli di ML si basano su algoritmi e modelli statistici che implementano attività basate su modelli di dati e inferenze. In altre parole, l'ML utilizza i dati di input per prevedere gli output, aggiornando continuamente gli output man mano che diventano disponibili nuovi dati.

Nei siti web retail, ad esempio, gli algoritmi di machine learning influenzano le decisioni di acquisto dei consumatori formulando consigli basati sulla cronologia degli acquisti. Le piattaforme di e-commerce di molti rivenditori, tra cui quelle di IBM, Amazon, Google, Meta e Netflix, si affidano alle reti neurali artificiali (ANN) per fornire consigli personalizzati. E i rivenditori utilizzano spesso i dati provenienti da chatbot e assistenti virtuali, insieme alla tecnologia di ML e di elaborazione del linguaggio naturale (NLP), per automatizzare le esperienze di acquisto degli utenti.

Tipi di machine learning

Gli algoritmi di machine learning si dividono in cinque grandi categorie: apprendimento supervisionato, apprendimento non supervisionato, apprendimento semi-supervisionato, supervisione autonoma e apprendimento per rinforzo.

1. Machine learning supervisionato

 

Il machine learning supervisionato è un tipo di machine learning in cui il modello viene addestrato su un set di dati etichettato (ad esempio, è nota la variabile target o di risultato). Per esempio, se i data scientist stessero costruendo un modello per la previsione dei tornado, le variabili di input potrebbero includere la data, il luogo, la temperatura, i modelli di flusso del vento e altro ancora, e l'output sarebbe l'attività effettiva dei tornado registrata in quei giorni.

L'apprendimento supervisionato viene generalmente utilizzato per la valutazione del rischio, il riconoscimento delle immagini, gli analytics predittivi e il rilevamento delle frodi e comprende diversi tipi di algoritmi.

  • Algoritmi di regressione: prevedono i valori di output identificando le relazioni lineari tra valori reali o continui (ad esempio, temperatura, salario). Gli algoritmi di regressione includono regressione lineare, foresta casuale e gradient boosting, nonché altri sottotipi.
  • Algoritmi di classificazione: prevedono variabili di output categoriche (ad esempio, "spazzatura" o "non spazzatura") etichettando i dati di input. Gli algoritmi di classificazione includono, tra gli altri, la regressione logistica, il k-nearest neighbors e le macchine a vettori di supporto (SVM).
  • Classificatori Naïve Bayes: consentono attività di classificazione per set di dati di grandi dimensioni. Fanno anche parte di una famiglia di algoritmi di apprendimento generativo che modellano la distribuzione dell'input di una determinata classe o categoria. Gli algoritmi Naïve Bayes includono alberi decisionali, in grado di soddisfare sia gli algoritmi di regressione che di classificazione.
  • Reti neurali: simulano il modo in cui funziona il cervello umano, con un numero enorme di nodi di elaborazione collegati che possono facilitare processi come la traduzione del linguaggio naturale, il riconoscimento delle immagini, il riconoscimento vocale e la creazione di immagini.
  • Algoritmi di foresta casuale: consentono di stimare un valore o una categoria combinando i risultati di una serie di alberi decisionali.

2. Machine learning non supervisionato

 

Gli algoritmi di apprendimento non supervisionato, come Apriori, Gaussian Mixture Models (GMMs) e analisi delle componenti principali (PCA), consentono di trarre inferenze da set di dati non etichettati, facilitando l'analisi esplorativa dei dati e consentendo il riconoscimento dei modelli e la modellazione predittiva.

Il metodo di apprendimento non supervisionato più comune è l'analisi dei cluster, che utilizza algoritmi di clustering per categorizzare i punti dati in base alla somiglianza di valore (come la segmentazione del cliente o il rilevamento di anomalie). Gli algoritmi di associazione consentono ai data scientist di identificare le associazioni tra gli oggetti dati all'interno di grandi database, facilitando la visualizzazione dei dati e la riduzione della dimensionalità.

  • K-means clustering: assegna i punti dati in gruppi K, in cui i punti dati più vicini a un determinato centroide sono raggruppati nella stessa categoria e K rappresenta i cluster in base alla loro dimensione e al livello di granularità. Il k-means clustering è comunemente utilizzato per la segmentazione del mercato, il clustering di documenti, la segmentazione di immagini e la compressione di immagini.
  • Clustering gerarchico: descrive un insieme di tecniche di clustering, tra cui il clustering agglomerativo, in cui i punti dati vengono inizialmente isolati in gruppi e poi uniti iterativamente in base alla somiglianza fino a quando non rimane un cluster, e il clustering divisivo, in cui un singolo cluster di dati viene diviso in base alle differenze tra i punti dati.
  • Clustering probabilistico: aiuta a risolvere i problemi di stima della densità o di clustering "soft" raggruppando i punti dati in base alla probabilità che appartengano a una particolare distribuzione.

I modelli di ML non supervisionati sono spesso alla base dei sistemi di raccomandazione del tipo "i clienti che hanno acquistato questo hanno acquistato anche...".

3. Machine learning auto-supervisionato

 

L'apprendimento auto-supervisionato (SSL) consente ai modelli di addestrarsi su dati non etichettati, invece di richiedere enormi set di dati annotati e/o etichettati. Gli algoritmi SSL, chiamati anche algoritmi predittivi o di apprendimento pretestuale, apprendono una parte dell'input da un'altra parte, generando automaticamente etichette e trasformando i problemi non supervisionati in quelli supervisionati. Questi algoritmi sono particolarmente utili per lavori come la computer vision e l'NLP, in cui il volume di dati di addestramento etichettati necessari per addestrare i modelli può essere eccezionalmente elevato (a volte in modo proibitivo).

4. Apprendimento per rinforzo

 

L'apprendimento per rinforzo, chiamato anche apprendimento per rinforzo da feedback umano (RLHF), è un tipo di programmazione dinamica che addestra gli algoritmi utilizzando un sistema di ricompensa e punizione. Per implementare l'apprendimento per rinforzo, un agente intraprende azioni in un ambiente specifico per raggiungere un obiettivo predeterminato. L'agente viene ricompensato o penalizzato per le sue azioni in base a una metrica stabilita (in genere punti), che lo incoraggia a continuare le buone pratiche e a scartare quelle cattive. Con la ripetizione, l'agente apprende le migliori strategie.

Gli algoritmi di apprendimento per rinforzo sono comuni nello sviluppo di videogiochi e sono spesso utilizzati per insegnare ai robot come replicare i compiti umani.

5. Apprendimento semi-supervisionato

 

Il quinto tipo di tecnica di machine learning offre una combinazione tra apprendimento supervisionato e non supervisionato.

Gli algoritmi di apprendimento semi-supervisionato vengono addestrati su un piccolo set di dati etichettato e su un grande set di dati non etichettato, dove i dati etichettati guidano il processo di apprendimento la grande quantità di dati non etichettati. Un modello di apprendimento semi-supervisionato potrebbe utilizzare l'apprendimento non supervisionato per identificare i cluster di dati e quindi utilizzare l'apprendimento supervisionato per etichettare i cluster.

Le reti generative avversarie (GAN), uno strumento dideep learning che genera dati non etichettati formando due reti neurali, sono un esempio di machine learning semi-supervisionato.

Indipendentemente dal tipo, i modelli di ML possono ricavare insight dai dati aziendali, ma la loro vulnerabilità ai pregiudizi umani/dati rende le pratiche di AI responsabile un imperativo organizzativo.

Gestisci una serie di modelli di machine learning con watsonx.ai

Quasi tutti, dagli sviluppatori agli utenti, fino alle autorità di regolamentazione, a un certo punto utilizzano le applicazioni di machine learning, indipendentemente dal fatto che interagiscano o meno direttamente con la tecnologia AI. L'adozione della tecnologia ML sta solo accelerando; il mercato globale del machine learning è stato valutato 19 miliardi di dollari nel 2022 e dovrebbe raggiungere 188 miliardi di dollari entro il 2030 (un CAGR superiore al 37%).

La portata dell'adozione dell'ML e il suo crescente impatto sul business rendono la comprensione delle tecnologie AI e ML un impegno costante e di vitale importanza, che richiede un monitoraggio vigile e aggiustamenti tempestivi man mano che le tecnologie si evolvono. Con lo studio AI IBM watsonx.ai™, gli sviluppatori possono gestire gli algoritmi e i processi di ML con facilità.

IBM watsonx.ai, parte del portfolio di prodotti AI IBM watsonx™, combina nuove funzionalità di AI generativa e uno studio aziendale di nuova generazione per aiutare i builder AI ad addestrare, convalidare, adattare e distribuire i modelli AI con una frazione dei dati, in una frazione di tempo. watsonx.ai offre ai team caratteristiche avanzate di generazione e classificazione dei dati che aiutano le aziende a utilizzare gli insight sui dati per prestazioni di AI ottimali nel mondo reale.

Nell'era della proliferazione dei dati, l'AI e il machine learning sono parte integrante delle operazioni aziendali quotidiane tanto quanto dell'innovazione tecnologica e della concorrenza aziendale. Ma come nuovi pilastri di una società moderna, rappresentano anche un'opportunità per diversificare le infrastrutture IT aziendali e creare tecnologie che funzionino a beneficio delle imprese e delle persone che dipendono da esse.

 
Fai il passo successivo

Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.

Esplora watsonx.ai Prenota una demo live