Métodos para ajustar modelos de base

Obtenga más información sobre los diferentes métodos de ajuste en watsonx.ai y cómo elegir el método adecuado para su solución.

Los modelos de cimentación pueden ajustarse de las siguientes maneras:

Ajuste completo

Partiendo de los conocimientos previos del modelo base, el ajuste fino completo adapta el modelo mediante su entrenamiento con un conjunto de datos más pequeño y específico para la tarea. El método de ajuste completo cambia las ponderaciones de los parámetros de un modelo cuyas ponderaciones se establecieron mediante un entrenamiento previo para personalizar el modelo para una tarea.

El resultado de un ajuste completo es un modelo totalmente nuevo. Debido a que todos los pesos del modelo están ajustados, el ajuste fino completo es una técnica más cara que otras técnicas de ajuste eficientes en cuanto a parámetros. Se requieren más recursos informáticos y de almacenamiento para alojar el nuevo modelo ajustado que se crea mediante el ajuste fino de un modelo base. Ver Ajuste fino completo.

Ajuste fino mediante adaptación de rango bajo (LoRA)

Adapta un modelo base a una tarea modificando los pesos de un subconjunto representativo de los parámetros del modelo, denominados «adaptadores de rango bajo», en lugar de los pesos del modelo base durante el ajuste. En el momento de la inferencia, los pesos de los adaptadores ajustados se añaden a los pesos del modelo base para generar un resultado ajustado a una tarea. Consulte el ajuste fino de la adaptación de rango bajo ( LoRA ).

Ajuste fino de la adaptación cuantificada de rango bajo (QLoRA)

QLoRA es una variante de « LoRA » que incorpora cuantificación para reducir aún más el consumo de memoria y los recursos computacionales necesarios durante la sintonización. Consulte el ajuste fino de la adaptación cuantificada de rango bajo ( QLoRA ).

Comparación de métodos de ajuste

En la tabla siguiente se comparan los métodos de ajuste disponibles en función de criterios comunes para elegir un método de ajuste.

Comparación del método de ajuste del modelo de cimentación
Criterios Ajuste fino completo LoRA ajuste fino QLoRA ajuste fino
Técnica de ajuste Todos los parámetros del modelo base se ajustan en la tarea de destino. Se ajustan los adaptadores que representan un subconjunto de parámetros del modelo; los parámetros del modelo base permanecen fijos durante el ajuste. Se ajustan los adaptadores que representan un subconjunto de parámetros del modelo; los parámetros del modelo base permanecen fijos durante el ajuste.
Resultados ajustados del modelo Eficaz a la hora de personalizar un modelo para una nueva tarea o dominio cuando se le proporcionan suficientes datos y recursos informáticos. Alto rendimiento con un riesgo reducido de sobreajuste; es posible que no alcance el nivel de rendimiento de ajuste fino completo. Alto rendimiento con un riesgo reducido de sobreajuste; es posible que no alcance el nivel de rendimiento de ajuste fino completo. Posible degradación de la calidad introducida por la cuantización.
Recursos informáticos necesarios Alta. Se requieren grandes recursos computacionales y memoria para actualizar completamente los parámetros del modelo. Moderado. Requiere menos recursos que el ajuste fino completo porque solo se ajustan los adaptadores; el modelo subyacente no se altera durante el ajuste. Bajo. Requiere menos recursos que el ajuste fino de l LoRA, ya que los pesos del modelo se cuantifican para reducir las necesidades de cálculo y almacenamiento.
Duración del tiempo de sintonización Largo. La duración exacta depende del modelo y del tamaño del conjunto de datos. Moderado. Más rápido que el ajuste fino completo, pero lleva tiempo modificar los adaptadores; puede variar de una a muchas horas. Moderado. Más rápido que el ajuste fino completo, pero lleva tiempo modificar los adaptadores; puede variar de una a muchas horas.
Coste Hay que tener en cuenta el coste de los recursos adicionales necesarios tanto para afinar el modelo como para desplegar y alojar el nuevo modelo afinado que se genere. Requiere menos recursos de almacenamiento y computación. Se pueden utilizar varios adaptadores de LoRA s con el mismo modelo base para ahorrar costes. Requiere menos recursos de almacenamiento y computación que LoRA. Se pueden utilizar varios adaptadores de e LoRA s utilizando el mismo modelo cuantizado base para ahorrar costes.
Finalidad Ideal para situaciones en las que la máxima precisión y la adaptación a tareas específicas son fundamentales y se justifican recursos y costes adicionales para el caso de uso. Una buena opción para crear adaptadores específicos de tareas para ajustar un modelo de base para múltiples tareas. Una buena opción para crear adaptadores específicos de tareas para ajustar un modelo de base cuantizada para múltiples tareas.