La funzione di Huber, chiamata anche smooth L1 loss, mira a bilanciare i punti di forza sia del MAE che del MSE. Incorpora un iperparametro regolabile, δ, che funge da punto di transizione: per valori di perdita inferiori o uguali a δ, la perdita di Huber è quadratica (come MSE); per valori di perdita maggiori di δ, la perdita di Huber è lineare (come MAE).
La perdita di Huber offre quindi una funzione completamente differenziabile con la robustezza di MAE rispetto ai valori anomali e la facilità di ottimizzazione di MSE attraverso la discesa del gradiente. Il passaggio dal comportamento quadratico a quello lineare a δ comporta anche un'ottimizzazione meno soggetta a problemi quali la scomparsa o l'esplosione dei gradienti rispetto alla perdita di MSE.
Questi vantaggi sono mitigati dalla necessità di definire attentamente δ, aggiungendo complessità allo sviluppo del modello. La funzione di Huber è più appropriata quando né MSE né MAE possono produrre risultati soddisfacenti, ad esempio quando un modello deve essere resistente agli outlier ma deve comunque penalizzare severamente i valori estremi che superano una certa soglia specifica.