L'ottimizzazione bayesiana è un algoritmo di ottimizzazione sequenziale basata su modelli (SMBO) in cui ogni iterazione di test migliora il metodo di campionamento della successiva. Le ricerche a griglia e quelle randomizzate possono essere eseguite contemporaneamente, ma ogni test viene eseguito in modo isolato: i data scientist non possono utilizzare ciò che hanno appreso per informare i test successivi.
Sulla base di test precedenti, l'ottimizzazione bayesiana seleziona in modo probabilistico un nuovo set di valori di iperparametri che probabilmente fornirà risultati migliori. Il modello probabilistico è indicato come surrogato della funzione obiettivo originale. Poiché i modelli surrogati sono efficienti dal punto di vista del calcolo, vengono aggiornati e migliorati ogni volta che viene eseguita la funzione obiettivo.
Più il surrogato riesce a prevedere gli iperparametri ottimali, più veloce diventa il processo, con una richiesta di meno test funzionali oggettivi. Ciò rende l'ottimizzazione bayesiana molto più efficiente rispetto agli altri metodi, poiché evita di perdere tempo in combinazioni inadatte di valori di iperparametri.
Il processo di determinazione statistica della relazione tra un risultato, in questo caso le migliori prestazioni del modello, e un insieme di variabili è noto come analisi di regressione. I processi gaussiani sono uno degli SMBO più popolari tra i data scientist.