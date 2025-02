La regressione lineare e la regressione logistica sono entrambi modelli predittivi alla base del machine learning. La regressione lineare (o minimi quadrati ordinari) mira a misurare e prevedere l'impatto di uno o più predittori su un dato output, trovando la linea di migliore adattamento attraverso i punti dati forniti (ovvero, i dati di addestramento). La regressione logistica mira a stabilire le probabilità di una classe attraverso un output binario, data una serie di predittori. In altre parole, la regressione lineare effettua previsioni quantitative costanti mentre la regressione logistica produce previsioni categoriche discrete.5

Naturalmente, all'aumentare del numero di predittori in entrambi i modelli di regressione, la relazione input-output non è sempre semplice e richiede la manipolazione della formula di regressione. Entra in gioco la regolarizzazione. Ci sono tre forme principali di regolarizzazione per i modelli di regressione. Si noti che questo elenco è solo una breve panoramica. L'applicazione di queste tecniche di regolarizzazione nella regressione lineare o logistica varia nei minimi dettagli.

- La regressione lasso (o regolarizzazione L1) è una tecnica di regolarizzazione che penalizza i coefficienti correlati di alto valore. Introduce un termine di regolarizzazione (chiamato anche termine di penalità) nella funzione di perdita della somma degli errori al quadrato (SSE) del modello. Questo termine di penalità è il valore assoluto della somma dei coefficienti. A sua volta controllato dall'iperparametro lambda (λ), riduce a zero i pesi delle funzioni selezionate. La regressione lasso rimuove quindi completamente le caratteristiche multicollineari dal modello.

- La regressione ridge (o regolarizzazione L2) è una tecnica di regolarizzazione che penalizza in modo simile i coefficienti ad alto valore introducendo un termine di penalità nella funzione di perdita dell'SSE. Tuttavia, differisce dalla regressione. Innanzitutto, il termine di penalità nella regressione ridge è la somma al quadrato dei coefficienti anziché il valore assoluto dei coefficienti. In secondo luogo, la regressione non mette in atto la selezione delle caratteristiche. Mentre il termine di penalità della regressione lasso può rimuovere le caratteristiche dal modello riducendo i valori dei coefficienti a zero, la regressione ridge riduce i pesi delle caratteristiche solo verso zero ma mai a zero.

- La regolarizzazione elastic net essenzialmente combina entrambe la regressioni, ridge e lasso, ma inserisce i termini di penalità L1 e L2 nella funzione di perdita dell'SSE. L2 e L1 ricavano il loro valore di penalità, rispettivamente, al quadrato o derivando il valore assoluto della somma dei pesi della caratteristica. Elastic net inserisce entrambi questi valori di penalità nell'equazione della funzione di costo (SSE). In questo modo, elastic net affronta la multicollinearità consentendo inoltre la selezione delle caratteristiche.6

In statistica, questi metodi prendono anche il nome di "contrazione dei coefficienti", in quanto riducono i valori dei coefficienti predittivi nel modello predittivo. In tutte e tre le tecniche, l'intensità del termine di penalità è controllata da lambda, che può essere calcolata utilizzando varie tecniche di convalida incrociata.