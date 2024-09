- Custos computacionais. O aprendizado por transferência reduz os custos computacionais necessários para criar modelos para novos problemas. Ao reaproveitar modelos ou redes pré-treinados para lidar com uma tarefa diferente, os usuários podem reduzir a quantidade de tempo de treinamento do modelo, os dados de treinamento, as unidades de processador e outros recursos computacionais. Por exemplo, um número menor de épocas, ou seja, passagens através de um conjunto de dados — pode ser necessário para atingir a taxa de aprendizado desejada. Dessa forma, o aprendizado por transferência pode acelerar e simplificar os processos de treinamento de modelos.

- Tamanho do conjunto de dados. O aprendizado por transferência ajuda em particular a diminuir as dificuldades envolvidas na aquisição de grandes conjuntos de dados. Os grandes modelos de linguagem (LLMs), por exemplo, exigem grandes quantidades de dados de treinamento para obter o desempenho ideal. Os conjuntos de dados de qualidade publicamente disponíveis podem ser limitados, e produzir dados com rotulagem manual suficientes pode ser demorado e caro.

- Generalizabilidade. Além do aprendizado por transferência ajudar na otimização do modelo, ele pode aumentar ainda mais a generalizabilidade do modelo. Como a aprendizado por transferência envolve o retreinamento do modelo existente com um novo conjunto de dados, o modelo retreinado consistirá no conhecimento obtido a partir de vários conjuntos de dados. Ele poderá apresentar melhor desempenho em uma variedade maior de dados do que o modelo básico inicial treinado em apenas um tipo de conjunto de dados. Assim, o aprendizado por transferência é capaz de inibir o overfitting.4

É claro que a transferência de conhecimento de um domínio para outro não é capaz de compensar o impacto negativo de dados de baixa qualidade. Técnicas de pré-processamento e engenharia de recursos, como por exemplo aumento de dados e extração de características, ainda são necessários ao usar o aprendizado por transferência.