La optimización bayesiana es un algoritmo de optimización secuencial basado en modelos (SMBO) en el que cada iteración de las pruebas mejora el método de muestreo de la siguiente. Tanto las búsquedas en cuadrícula como las aleatorias se pueden realizar simultáneamente, pero cada prueba se realiza de forma aislada: los científicos de datos no pueden utilizar lo que han aprendido para elaborar pruebas posteriores.
Basándose en pruebas anteriores, la optimización bayesiana selecciona probabilísticamente un nuevo conjunto de valores de hiperparámetros que puede que ofrezcan mejores resultados. El modelo probabilístico se denomina sustituto de la función objetivo original. Dado que los modelos sustitutos son eficientes desde el punto de vista informático, suelen actualizarse y mejorarse cada vez que se ejecuta la función objetivo.
Cuanto mejor sea el sustituto en la predicción de hiperparámetros óptimos, el proceso se vuelve más rápido y se necesitan menos pruebas de la función objetivo. Esto hace que la optimización bayesiana sea mucho más eficiente que los otros métodos, ya que no se pierde tiempo en combinaciones inadecuadas de valores de hiperparámetros.
El proceso de determinar estadísticamente la relación entre un resultado (en este caso, el mejor rendimiento del modelo) y un conjunto de variables se conoce como análisis de regresión. Los procesos gaussianos son uno de los SMBO más populares entre los científicos de datos.