I termini "algoritmo" e "modello" sono spesso usati in modo intercambiabile, ma rappresentano concetti distinti (anche se correlati). Algoritmo è un termine generico che indica un processo graduale, solitamente descritto in linguaggio matematico o pseudocodice, per eseguire una funzione o uno scopo. Nel contesto dell'intelligenza artificiale, un modello AI è qualsiasi programma che riceve dati di input e produce un output o una decisione senza ulteriore intervento umano.
Un algoritmo di machine learning è un insieme definito di passaggi utilizzati per addestrare un modello di machine learning in modo che possa fare previsioni utili nel suo caso d'uso reale. Comprende non solo il modo in cui il modello mappa un punto dati di input al suo output corrispondente, ma anche il processo di ottimizzazione delle previsioni del modello per "adattarle" a un set di dati di addestramento di esempi rilevanti. È un algoritmo che consente a una macchina di apprendere dai dati.
In termini semplici, il risultato dell'applicazione di un algoritmo di machine learning a un set di dati è un modello addestrato. Il termine "addestramento" può essere inteso come un processo iterativo di aggiornamento dei parametri del modello (gli aspetti regolabili della logica matematica che il modello utilizza per fare previsioni o decisioni sui dati di input) in modo da produrre output più utili.
Sebbene esistano algoritmi di machine learning (ML) progettati esplicitamente per addestrare i modelli a eseguire una singola attività specifica, questa è un'eccezione piuttosto che una regola. In generale, ogni algoritmo di ML ha particolari qualità matematiche o pratiche utili per determinati tipi di attività (o determinati tipi o quantità di dati). In molti casi, la stessa tecnica di machine learning può essere utilizzata per addestrare modelli per più attività (anche se simili). Al contrario, ci sono quasi sempre più algoritmi di ML adatti all'addestramento di un modello per una determinata attività.
Il vantaggio principale degli algoritmi di machine learning è che consentono ai modelli di intelligenza artificiale di apprendere implicitamente dall'esperienza. Questo è in contrasto con le tecniche di intelligenza artificiale "classiche" o "basate su regole", che richiedono un data scientist, un esperto o un ingegnere di ML per programmare manualmente ed esplicitamente il processo decisionale del modello. Negli ultimi decenni, i sistemi di machine learning sono emersi come la modalità dominante di intelligenza artificiale e analisi dei dati rispetto all'intelligenza artificiale basata su regole perché, tra le altre ragioni, il machine learning implicito basato sui dati è intrinsecamente più flessibile, scalabile e accessibile.
Detto questo, è essenziale notare che adattare un modello ai suoi dati di addestramento è semplicemente un mezzo per raggiungere un fine. La premessa fondamentale del machine learning è che se ottimizzi le prestazioni di un modello su attività di esempio che assomigliano adeguatamente ai problemi del mondo reale per cui verrà utilizzato, il modello addestrato funzionerà bene anche su nuovi dati che non ha visto durante l'addestramento. L'obiettivo finale del machine learning è la generalizzazione, ovvero la traduzione delle prestazioni sui dati di addestramento a nuovi dati non visti. Un'attenzione miope all'addestramento a sé stante rischia l'overfitting, un fenomeno in cui la conoscenza di un modello è così accuratamente adattata ai modelli contenuti nei suoi dati di addestramento che non può generalizzare, producendo un modello che eccelle nell'addestramento ma fallisce negli scenari del mondo reale.
L'addestramento di un utile modello di machine learning implica quindi non solo la selezione e la configurazione di un tipo appropriato di algoritmo di machine learning, ma anche la corretta cura dei dati di addestramento e una convalida ponderata delle prestazioni post-addestramento.