Métodos para Ajustar Modelos de Base

Saiba mais sobre os diferentes métodos de ajuste em watsonx.ai e como escolher o método adequado para sua solução.

Os modelos de fundação podem ser ajustados das seguintes maneiras:

Ajuste fino completo

Partindo do conhecimento prévio do modelo base, o ajuste fino completo adapta o modelo por meio de um ajuste com um conjunto de dados menor e específico para a tarefa. O método de ajuste fino completo altera os pesos dos parâmetros de um modelo cujos pesos foram definidos por meio de treinamento prévio para personalizar o modelo para uma tarefa.

O resultado de um ajuste fino completo é um modelo totalmente novo. Como todos os pesos do modelo são ajustados, o ajuste fino completo é uma técnica mais cara do que outras técnicas de ajuste eficiente de parâmetros. São necessários mais recursos de computação e armazenamento para hospedar o novo modelo ajustado que você cria ao fazer o ajuste fino de um modelo básico. Consulte Ajuste fino completo.

Ajuste fino por adaptação de baixa dimensão (LoRA)

Adapta um modelo de base a uma tarefa alterando os pesos de um subconjunto representativo dos parâmetros do modelo, chamados de adaptadores de baixa dimensão, em vez dos pesos do modelo base durante o ajuste. No momento da inferência, os pesos dos adaptadores ajustados são adicionados aos pesos do modelo de base para gerar um resultado ajustado para uma tarefa. Consulte o ajuste fino da adaptação de baixa dimensão ( LoRA ).

Ajuste fino da adaptação quantizada de baixa dimensão (QLoRA)

QLoRA é uma variante do algoritmo de otimização de frequências ( LoRA ) que incorpora quantização para reduzir ainda mais o consumo de memória e os recursos computacionais necessários durante a otimização. Consulte o ajuste fino da adaptação quantizada de baixa dimensão ( QLoRA ).

Comparação do método de ajuste

A tabela a seguir compara os métodos de ajuste disponíveis com base em critérios comuns para a escolha de um método de ajuste.

Comparação do método de ajuste do modelo de fundação
Critérios Ajuste fino completo LoRA ajuste fino QLoRA ajuste fino
Técnica de ajuste Todos os parâmetros do modelo básico são ajustados com precisão na tarefa de destino. Os adaptadores que representam um subconjunto de parâmetros do modelo são ajustados; os parâmetros do modelo básico permanecem fixos durante o ajuste. Os adaptadores que representam um subconjunto de parâmetros do modelo são ajustados; os parâmetros do modelo básico permanecem fixos durante o ajuste.
Resultados do modelo ajustado Eficaz na personalização de um modelo para uma nova tarefa ou domínio quando recebe dados e recursos de computação suficientes. Alto desempenho com risco reduzido de sobreajuste; pode não atingir o nível de desempenho de ajuste fino completo. Alto desempenho com risco reduzido de sobreajuste; pode não atingir o nível de desempenho de ajuste fino completo. Possível degradação da qualidade introduzida pela quantização.
Recursos de computação necessários Alta. São necessários grandes recursos de computação e memória para atualizar totalmente os parâmetros do modelo. Moderado. Requer menos recursos do que o ajuste fino completo porque somente os adaptadores são ajustados; o modelo subjacente não é alterado durante o ajuste. Baixo. Requer menos recursos do que o ajuste fino do LoRA porque os pesos do modelo são quantizados para reduzir as necessidades computacionais e de armazenamento.
Duração do tempo de sintonia Longo. A duração exata depende do tamanho do modelo e do conjunto de dados. Moderado. Mais rápido do que o ajuste fino completo, mas leva tempo para modificar os adaptadores; pode variar de uma a várias horas. Moderado. Mais rápido do que o ajuste fino completo, mas leva tempo para modificar os adaptadores; pode variar de uma a várias horas.
Custo Considere o custo dos recursos adicionais necessários para ajustar o modelo e para implantar e hospedar o novo modelo ajustado que é gerado. Requer menos recursos de armazenamento e computação. Vários adaptadores LoRA podem ser atendidos usando o mesmo modelo básico para economizar custos. Requer menos recursos de armazenamento e computação do que o site LoRA. Vários adaptadores LoRA podem ser atendidos usando o mesmo modelo básico quantizado para economizar custos.
Propósito Melhor para cenários em que a precisão máxima e a adaptação específica da tarefa são essenciais e os recursos e custos adicionais são justificados para o caso de uso. Uma boa opção para criar adaptadores específicos de tarefas para ajustar um modelo básico para várias tarefas. Uma boa opção para criar adaptadores específicos de tarefas para ajustar um modelo de base quantizada para várias tarefas.