La optimización bayesiana es un algoritmo de optimización secuencial basado en modelos (SMBO) en el que cada iteración de las pruebas mejora el método de ejemplificación de la siguiente. Tanto las búsquedas en cuadrícula como las aleatorias se pueden realizar simultáneamente, pero cada prueba se realiza de forma aislada: los científicos de datos no pueden usar lo que aprendieron para fundamentar pruebas posteriores.
Con base en pruebas anteriores, la optimización bayesiana selecciona de forma probabilística un nuevo conjunto de valores de hiperparámetros que probablemente produzca mejores resultados. El modelo probabilístico se considera un sustituto de la función objetivo original. Debido a que los modelos sustitutos son computacionalmente eficientes, generalmente se actualizan y mejoran cada vez que se ejecuta la función objetivo.
Cuanto mejor sea el sustituto para predecir hiperparámetros óptimos, más rápido se vuelve el proceso, y se requerirán menos pruebas de función objetiva. Esto hace que la optimización bayesiana sea mucho más eficiente que los otros métodos, ya que no se pierde tiempo en combinaciones inadecuadas de valores de hiperparámetros.
El proceso de determinar estadísticamente la relación entre un resultado (en este caso, el mejor rendimiento del modelo) y un conjunto de variables se conoce como análisis de regresión. Los procesos gaussianos son una de esos populares SMBO entre los científicos de datos.