La modellazione mediante il machine learning esiste a causa dell'incertezza. Se potessimo mappare perfettamente gli input con gli output, non ci sarebbe bisogno di modelli. Tuttavia, i dati del mondo reale sono disordinati, incompleti e rumorosi, quindi modelliamo le probabilità invece delle certezze. Conoscere le probabilità pone i fondamenti di tutto ciò che riguarda il machine learning e l'AI (IA). Le teorie delle probabilità ci permettono di comprendere i dati che abbiamo usato per modellare in modo bello ed elegante. Riveste un ruolo critico nella modellazione delle incertezze nelle previsioni dei modelli di ML. Ci aiuta a quantificare la verosimiglianza, la probabilità e le certezze per un modello statistico in modo da poter misurare con sicurezza i modelli di risultato che creiamo. Immergersi nel mondo delle probabilità e apprendere i fondamenti ti aiuterà a comprendere le basi di tutti i modelli di apprendimento statistico e come si realizzano le loro previsioni. Imparerai come possiamo fare inferenze e produrre risultati probabilistici.
Per apprendere le distribuzioni più diffuse e modellare i dati con sicurezza, andiamo alle basi e chiariamo alcune terminologie.
Variabile casuale: una rappresentazione numerica di un risultato di un fenomeno casuale. È una variabile i cui possibili valori sono risultati numerici di un processo casuale.
Variabile casuale discreta: una variabile casuale che può assumere un numero finito o contabilmente infinito di valori distinti. Ad esempio, l'esito di un lancio di una moneta (Testa = 1, Croce = 0) o il numero di e-mail di spam ricevute in un'ora.
Variabile casuale continua: una variabile casuale che può assumere qualsiasi valore all'interno di un determinato intervallo. Ad esempio, l'altezza di una persona, la temperatura in una stanza o la quantità di pioggia.
Evento: un insieme di uno o più risultati di un processo casuale. Ad esempio, ottenere un numero pari lanciando un dado (risultati: 2, 4, 6) o un cliente che se ne va.
Risultato: un singolo possibile risultato di un esperimento casuale. Ad esempio, lanciare una moneta produce "Testa" o " Croce".
Probabilità : una misura numerica della probabilità che un evento avverrà, da 0 (impossibile) a 1 (certo).
Probabilità condizionata : La probabilità dell'evento di verificarsi, dato che l'evento è già avvenuto. Questo passaggio è fondamentale nell'ML, poiché spesso vogliamo prevedere un risultato in base a caratteristiche specifiche.
La probabilità è una misura di quanto sia probabile che un evento accada, variando da 0 (impossibile) a 1 (certo).
Nel machine learning, questo spesso assume la forma di probabilità condizionata
Esempio: un modello di regressione logistica potrebbe dire
> “Età = 45, reddito = 60K USD e storia precedente
> la probabilità di abbandono è 0,82."
Questo esempio non significa che il cliente abbandonerà, ma si tratta di una convinzione basata sui modelli statistici nei dati di addestramento.
Nell'era moderna della gen AI, i modelli probabilistici come la regressione logistica svolgono un ruolo enorme nel determinare i risultati e gli output di un modello. Questo ruolo si manifesta spesso sotto forma di attivazione negli strati delle reti neurali.