Métodos para Ajustar Modelos de Base
Saiba mais sobre os diferentes métodos de ajuste em watsonx.ai e como escolher o método adequado para sua solução.
Os modelos de fundação podem ser ajustados das seguintes maneiras:
- Ajuste fino completo
Partindo do conhecimento prévio do modelo base, o ajuste fino completo adapta o modelo por meio de um ajuste com um conjunto de dados menor e específico para a tarefa. O método de ajuste fino completo altera os pesos dos parâmetros de um modelo cujos pesos foram definidos por meio de treinamento prévio para personalizar o modelo para uma tarefa.
O resultado de um ajuste fino completo é um modelo totalmente novo. Como todos os pesos do modelo são ajustados, o ajuste fino completo é uma técnica mais cara do que outras técnicas de ajuste eficiente de parâmetros. São necessários mais recursos de computação e armazenamento para hospedar o novo modelo ajustado que você cria ao fazer o ajuste fino de um modelo básico. Consulte Ajuste fino completo.
- Ajuste fino por adaptação de baixa dimensão (LoRA)
Adapta um modelo de base a uma tarefa alterando os pesos de um subconjunto representativo dos parâmetros do modelo, chamados de adaptadores de baixa dimensão, em vez dos pesos do modelo base durante o ajuste. No momento da inferência, os pesos dos adaptadores ajustados são adicionados aos pesos do modelo de base para gerar um resultado ajustado para uma tarefa. Consulte o ajuste fino da adaptação de baixa dimensão ( LoRA ).
- Ajuste fino da adaptação quantizada de baixa dimensão (QLoRA)
QLoRA é uma variante do algoritmo de otimização de frequências ( LoRA ) que incorpora quantização para reduzir ainda mais o consumo de memória e os recursos computacionais necessários durante a otimização. Consulte o ajuste fino da adaptação quantizada de baixa dimensão ( QLoRA ).
Comparação do método de ajuste
A tabela a seguir compara os métodos de ajuste disponíveis com base em critérios comuns para a escolha de um método de ajuste.
| Critérios | Ajuste fino completo | LoRA ajuste fino | QLoRA ajuste fino |
|---|---|---|---|
| Técnica de ajuste | Todos os parâmetros do modelo básico são ajustados com precisão na tarefa de destino. | Os adaptadores que representam um subconjunto de parâmetros do modelo são ajustados; os parâmetros do modelo básico permanecem fixos durante o ajuste. | Os adaptadores que representam um subconjunto de parâmetros do modelo são ajustados; os parâmetros do modelo básico permanecem fixos durante o ajuste. |
| Resultados do modelo ajustado | Eficaz na personalização de um modelo para uma nova tarefa ou domínio quando recebe dados e recursos de computação suficientes. | Alto desempenho com risco reduzido de sobreajuste; pode não atingir o nível de desempenho de ajuste fino completo. | Alto desempenho com risco reduzido de sobreajuste; pode não atingir o nível de desempenho de ajuste fino completo. Possível degradação da qualidade introduzida pela quantização. |
| Recursos de computação necessários | Alta. São necessários grandes recursos de computação e memória para atualizar totalmente os parâmetros do modelo. | Moderado. Requer menos recursos do que o ajuste fino completo porque somente os adaptadores são ajustados; o modelo subjacente não é alterado durante o ajuste. | Baixo. Requer menos recursos do que o ajuste fino do LoRA porque os pesos do modelo são quantizados para reduzir as necessidades computacionais e de armazenamento. |
| Duração do tempo de sintonia | Longo. A duração exata depende do tamanho do modelo e do conjunto de dados. | Moderado. Mais rápido do que o ajuste fino completo, mas leva tempo para modificar os adaptadores; pode variar de uma a várias horas. | Moderado. Mais rápido do que o ajuste fino completo, mas leva tempo para modificar os adaptadores; pode variar de uma a várias horas. |
| Custo | Considere o custo dos recursos adicionais necessários para ajustar o modelo e para implantar e hospedar o novo modelo ajustado que é gerado. | Requer menos recursos de armazenamento e computação. Vários adaptadores LoRA podem ser atendidos usando o mesmo modelo básico para economizar custos. | Requer menos recursos de armazenamento e computação do que o site LoRA. Vários adaptadores LoRA podem ser atendidos usando o mesmo modelo básico quantizado para economizar custos. |
| Propósito | Melhor para cenários em que a precisão máxima e a adaptação específica da tarefa são essenciais e os recursos e custos adicionais são justificados para o caso de uso. | Uma boa opção para criar adaptadores específicos de tarefas para ajustar um modelo básico para várias tarefas. | Uma boa opção para criar adaptadores específicos de tarefas para ajustar um modelo de base quantizada para várias tarefas. |