Nel machine learning, la regressione logistica appartiene alla famiglia di modelli di machine learning supervisionato. È anche considerato un modello discriminante, il che significa che cerca di distinguere tra le classi (o categorie). A differenza di un algoritmo generativo, come il naïve bayes, non può, come dice il nome, generare informazioni, come ad esempio un'immagine, della classe che sta cercando di prevedere (ad esempio la foto di un gatto).

In precedenza abbiamo detto che la regressione logistica massimizza la funzione di verosimiglianza logaritmica per determinare i coefficienti beta del modello. Questo cambia leggermente nel contesto del machine learning. Nel machine learning, la verosimiglianza logaritmica negativa viene utilizzata come funzione di perdita, utilizzando il processo di discesa del gradiente per trovare il massimo globale. Questo è solo un altro modo per arrivare alle stesse stime discusse in precedenza.

La regressione logistica può anche essere incline all'overfitting, in particolare quando all'interno del modello è presente un numero elevato di variabili predittive. La regolarizzazione viene generalmente utilizzata per penalizzare i parametri con coefficienti elevati quando il modello presenta un'elevata dimensionalità.

