El entrenamiento de modelos enseña a un modelo de machine learning a optimizar su rendimiento en un conjunto de datos de entrenamiento con tareas de muestra relevantes para los casos de uso finales. Estos datos deben parecerse a los problemas del mundo real a los que se enfrentará el modelo para que pueda aprender los patrones y relaciones de los datos y realizar predicciones precisas sobre nuevos datos.

Este proceso de aprendizaje consiste en ajustar los parámetros del modelo, así como los pesos y sesgos de las funciones matemáticas que conforman sus algoritmos subyacentes de machine learning. El objetivo de estos ajustes es obtener outputs más precisos.

Matemáticamente hablando, el objetivo de este proceso es minimizar una función de pérdida que cuantifica el error de los outputs del modelo. Cuando el output cae por debajo de un umbral determinado, se considera que el modelo está "entrenado". En el aprendizaje por refuerzo, el objetivo es inverso: se optimizan los parámetros del modelo para maximizar una función de recompensa en lugar de minimizar una función de pérdida.

El entrenamiento de modelos implica un ciclo de recopilación y preprocesamiento de datos, introducción de esos datos de entrenamiento en el modelo, medición de pérdidas, optimización de parámetros y prueba del rendimiento con datos de validación. Este flujo de trabajo se repite hasta obtener resultados satisfactorios. El entrenamiento también puede implicar el ajuste de hiperparámetros (opciones estructurales que influyen en el proceso de aprendizaje, pero que no son "aprendibles") en un proceso denominado ajuste de hiperparámetros.