O ajuste fino pode ser considerado um subconjunto da técnica mais ampla de aprendizagem por transferência: a prática de aproveitar o conhecimento que um modelo existente já aprendeu como ponto de partida para aprender novas tarefas.

A ideia por trás do ajuste fino é que é mais fácil e mais barato aprimorar os recursos de um modelo base treinado previamente que já adquiriu amplos conhecimentos relevantes para a tarefa em questão do que treinar um novo modelo do zero para esse propósito específico. Isso é especialmente válido para modelos de deep learning com milhões ou até mesmo bilhões de parâmetros, como os grandes modelos de linguagem (LLMs) que ganharam destaque no campo do processamento de linguagem natural (PLN) ou as complexas redes neurais convolucionais (CNNs) e os transformadores de visão (ViTs) utilizados para tarefas de computer Vision, como classificação de imagens, detecção de objetos ou segmentação de imagens.

Ao aproveitar o treinamento anterior do modelo por meio do aprendizado de transferência, o ajuste fino pode reduzir a quantidade de poder computacional caro e de dados rotulados necessários para obter grandes modelos adaptados a casos de uso de nicho e necessidades comerciais. Por exemplo, o ajuste fino pode ser usado para simplesmente ajustar o tom de conversa de um LLM pré-treinado ou o estilo de ilustração de um modelo de geração de imagem pré-treinado; ele também pode ser usado para complementar o aprendizado do conjunto de dados de treinamento original de um modelo com dados proprietários ou conhecimento especializado e específico do domínio.

O ajuste fino desempenha, portanto, um papel importante na aplicação real de modelos de aprendizado de máquina, ajudando a democratizar o acesso e a personalização de modelos sofisticados.