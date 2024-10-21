O ajuste fino consiste em fornecer a um modelo de IA dados adicionais suficientes para alterar alguns de seus parâmetros. O ajuste fino altera permanentemente o comportamento de um modelo, adaptando-o a um caso de uso ou contexto específico. Também é mais rápido e mais barato do que treinar um modelo totalmente novo.

"Se você tiver uma rede neural que tem 100 camadas diferentes, treinar significa que você está modificando todas as 100 camadas", explica Choie. “O ajuste fino significaria que você está realmente mudando as últimas camadas. Você ainda está modificando o modelo, mas não precisa alterá-lo completamente porque ele já está funcionando bem."

O ajuste fino requer um pouco mais de investimento inicial do que a engenharia de prompts e o RAG. É útil para transformar um modelo menor em um especialista em um domínio especializado. Por exemplo, uma seguradora pode ajustar um modelo para dominar a arte de processar novos sinistros.

Varshney compara um modelo aperfeiçoado a um novo funcionário intensivamente treinado que acaba de sair da escola. Eles podem não ter a amplitude de conhecimento que um polímata engenhoso (ou um grande modelo de IA de propósito geral) tem, mas são muito melhores no processamento de afirmações do que o polímata.

"Ele não pode pagar seus impostos ou escrever um contrato legal", diz Varshney, "mas se eu pedir para processar uma reclamação, ele saberá como fazer isso imediatamente."

O uso de dados proprietários dessas maneiras pode oferecer uma vantagem competitiva significativa, ao familiarizar os modelos de IA com os processos, produtos, clientes e outras nuances exclusivos de uma empresa.

"Se você tiver uma IA cujos principais usuários forem de uma empresa específica, é importante que a IA use dados dessa mesma empresa", diz Choie.

Quando os modelos de IA têm acesso a dados proprietários, eles são fundamentados em um contexto comercial específico, o que significa que suas produções também são fundamentadas nesse contexto.

"Posso pegar um modelo de IA aberto, ajustá-lo com meus próprios dados proprietários, e essa cópia é exclusivamente minha", diz Varshney. "Sou proprietário do IP por trás dele. Eu o executo na minha própria infraestrutura."

Como resultado, esses modelos podem produzir produções mais precisas e eficazes do que modelos não aprimorados e prontos para uso que extraem um conjunto geral de dados públicos.