Le tecnologie di machine learning (ML) possono guidare il processo decisionale in quasi tutti i settori, dall'assistenza sanitaria alle risorse umane fino alla finanza, e in innumerevoli casi d'uso, come la computer vision, i modelli linguistici di grandi dimensioni (LLM), il riconoscimento vocale, le auto a guida autonoma e altro ancora.
Tuttavia, l'influenza crescente dell'ML non è senza complicazioni. I set di dati di convalida e addestramento che sono alla base della tecnologia ML sono spesso aggregati da esseri umani e gli esseri umani sono suscettibili di pregiudizi e inclini all'errore. Anche nei casi in cui un modello di ML non è di per sé distorto o difettoso, la distribuzione nel contesto sbagliato può produrre errori con conseguenze dannose non intenzionali.
Ecco perché la diversificazione dell'uso di AI e ML in azienda può rivelarsi preziosa per mantenere un vantaggio competitivo. Ogni tipo e sottotipo di algoritmo di ML presenta benefici e funzionalità unici che i team possono utilizzare per attività diverse. Qui discuteremo i cinque tipi principali e le loro applicazioni.
L'ML è un sottoinsieme di informatica, data science e intelligenza artificiale (AI) che consente ai sistemi di apprendere e migliorare dai dati senza ulteriori interventi di programmazione.
Invece di utilizzare istruzioni esplicite per l'ottimizzazione delle prestazioni, i modelli di ML si basano su algoritmi e modelli statistici che implementano attività basate su modelli di dati e inferenze. In altre parole, l'ML utilizza i dati di input per prevedere gli output, aggiornando continuamente gli output man mano che diventano disponibili nuovi dati.
Nei siti web retail, ad esempio, gli algoritmi di machine learning influenzano le decisioni di acquisto dei consumatori formulando consigli basati sulla cronologia degli acquisti. Le piattaforme di e-commerce di molti rivenditori, tra cui quelle di IBM, Amazon, Google, Meta e Netflix, si affidano alle reti neurali artificiali (ANN) per fornire consigli personalizzati. E i rivenditori utilizzano spesso i dati provenienti da chatbot e assistenti virtuali, insieme alla tecnologia di ML e di elaborazione del linguaggio naturale (NLP), per automatizzare le esperienze di acquisto degli utenti.
Gli algoritmi di machine learning si dividono in cinque grandi categorie: apprendimento supervisionato, apprendimento non supervisionato, apprendimento semi-supervisionato, supervisione autonoma e apprendimento per rinforzo.
Il machine learning supervisionato è un tipo di machine learning in cui il modello viene addestrato su un set di dati etichettato (ad esempio, è nota la variabile target o di risultato). Per esempio, se i data scientist stessero costruendo un modello per la previsione dei tornado, le variabili di input potrebbero includere la data, il luogo, la temperatura, i modelli di flusso del vento e altro ancora, e l'output sarebbe l'attività effettiva dei tornado registrata in quei giorni.
L'apprendimento supervisionato viene generalmente utilizzato per la valutazione del rischio, il riconoscimento delle immagini, gli analytics predittivi e il rilevamento delle frodi e comprende diversi tipi di algoritmi.
Gli algoritmi di apprendimento non supervisionato, come Apriori, Gaussian Mixture Models (GMMs) e analisi delle componenti principali (PCA), consentono di trarre inferenze da set di dati non etichettati, facilitando l'analisi esplorativa dei dati e consentendo il riconoscimento dei modelli e la modellazione predittiva.
Il metodo di apprendimento non supervisionato più comune è l'analisi dei cluster, che utilizza algoritmi di clustering per categorizzare i punti dati in base alla somiglianza di valore (come la segmentazione del cliente o il rilevamento di anomalie). Gli algoritmi di associazione consentono ai data scientist di identificare le associazioni tra gli oggetti dati all'interno di grandi database, facilitando la visualizzazione dei dati e la riduzione della dimensionalità.
I modelli di ML non supervisionati sono spesso alla base dei sistemi di raccomandazione del tipo "i clienti che hanno acquistato questo hanno acquistato anche...".
L'apprendimento auto-supervisionato (SSL) consente ai modelli di addestrarsi su dati non etichettati, invece di richiedere enormi set di dati annotati e/o etichettati. Gli algoritmi SSL, chiamati anche algoritmi predittivi o di apprendimento pretestuale, apprendono una parte dell'input da un'altra parte, generando automaticamente etichette e trasformando i problemi non supervisionati in quelli supervisionati. Questi algoritmi sono particolarmente utili per lavori come la computer vision e l'NLP, in cui il volume di dati di addestramento etichettati necessari per addestrare i modelli può essere eccezionalmente elevato (a volte in modo proibitivo).
L'apprendimento per rinforzo, chiamato anche apprendimento per rinforzo da feedback umano (RLHF), è un tipo di programmazione dinamica che addestra gli algoritmi utilizzando un sistema di ricompensa e punizione. Per implementare l'apprendimento per rinforzo, un agente intraprende azioni in un ambiente specifico per raggiungere un obiettivo predeterminato. L'agente viene ricompensato o penalizzato per le sue azioni in base a una metrica stabilita (in genere punti), che lo incoraggia a continuare le buone pratiche e a scartare quelle cattive. Con la ripetizione, l'agente apprende le migliori strategie.
Gli algoritmi di apprendimento per rinforzo sono comuni nello sviluppo di videogiochi e sono spesso utilizzati per insegnare ai robot come replicare i compiti umani.
Il quinto tipo di tecnica di machine learning offre una combinazione tra apprendimento supervisionato e non supervisionato.
Gli algoritmi di apprendimento semi-supervisionato vengono addestrati su un piccolo set di dati etichettato e su un grande set di dati non etichettato, dove i dati etichettati guidano il processo di apprendimento la grande quantità di dati non etichettati. Un modello di apprendimento semi-supervisionato potrebbe utilizzare l'apprendimento non supervisionato per identificare i cluster di dati e quindi utilizzare l'apprendimento supervisionato per etichettare i cluster.
Le reti generative avversarie (GAN), uno strumento dideep learning che genera dati non etichettati formando due reti neurali, sono un esempio di machine learning semi-supervisionato.
Indipendentemente dal tipo, i modelli di ML possono ricavare insight dai dati aziendali, ma la loro vulnerabilità ai pregiudizi umani/dati rende le pratiche di AI responsabile un imperativo organizzativo.
Quasi tutti, dagli sviluppatori agli utenti, fino alle autorità di regolamentazione, a un certo punto utilizzano le applicazioni di machine learning, indipendentemente dal fatto che interagiscano o meno direttamente con la tecnologia AI. L'adozione della tecnologia ML sta solo accelerando; il mercato globale del machine learning è stato valutato 19 miliardi di dollari nel 2022 e dovrebbe raggiungere 188 miliardi di dollari entro il 2030 (un CAGR superiore al 37%).
La portata dell'adozione dell'ML e il suo crescente impatto sul business rendono la comprensione delle tecnologie AI e ML un impegno costante e di vitale importanza, che richiede un monitoraggio vigile e aggiustamenti tempestivi man mano che le tecnologie si evolvono. Con lo studio AI IBM watsonx.ai™, gli sviluppatori possono gestire gli algoritmi e i processi di ML con facilità.
IBM watsonx.ai, parte del portfolio di prodotti AI IBM watsonx™, combina nuove funzionalità di AI generativa e uno studio aziendale di nuova generazione per aiutare i builder AI ad addestrare, convalidare, adattare e distribuire i modelli AI con una frazione dei dati, in una frazione di tempo. watsonx.ai offre ai team caratteristiche avanzate di generazione e classificazione dei dati che aiutano le aziende a utilizzare gli insight sui dati per prestazioni di AI ottimali nel mondo reale.
Nell'era della proliferazione dei dati, l'AI e il machine learning sono parte integrante delle operazioni aziendali quotidiane tanto quanto dell'innovazione tecnologica e della concorrenza aziendale. Ma come nuovi pilastri di una società moderna, rappresentano anche un'opportunità per diversificare le infrastrutture IT aziendali e creare tecnologie che funzionino a beneficio delle imprese e delle persone che dipendono da esse.
Impara i concetti fondamentali e sviluppa le tue competenze con laboratori pratici, corsi, progetti guidati, prove e molto altro.
Scopri come incorporare in tutta sicurezza l’AI generativa e il machine learning nella tua azienda.
Vuoi ottenere un ritorno migliore sui tuoi investimenti nell’AI? Scopri come lo scaling della GenAI in settori chiave può favorire il cambiamento, aiutando le tue menti migliori a creare e fornire nuove soluzioni innovative.
Scopri come scegliere il foundation model di AI più adatto al tuo caso d’uso.
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com, openliberty.io