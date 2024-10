Meta-aprendizado baseado em otimização

O deep learning geralmente exige várias atualizações iterativas dos parâmetros do modelo por meio de retropropagação e do algoritmo de otimização de gradiente descendente. No meta-aprendizado baseado em otimização, às vezes chamado de meta-aprendizado baseado em gradiente, o algoritmo aprende quais parâmetros iniciais do modelo ou hiperparâmetros de redes neurais profundas podem ser ajustados com eficiência para tarefas relevantes. Isso geralmente significa meta-otimização, ou seja, a otimização do próprio algoritmo de otimização.

Meta-aprendiz de LSTM

Esse método de meta-aprendizado baseado em otimização utiliza uma arquitetura popular de rede neural recorrente chamada de redes de memória de longo e curto prazo (LSTM) para treinar um meta-aprendiz a adquirir conhecimento de longo prazo compartilhado entre tarefas e conhecimento de curto prazo em cada tarefa. Assim, o meta-aprendiz otimiza outro classificador de rede neural de aprendiz. Ele aprende uma inicialização dos parâmetros do aprendiz para convergência rápida de treinamento e como atualizar esses parâmetros de forma eficiente com um pequeno conjunto de treinamento, ajudando o aprendiz a se adaptar a novas tarefas com rapidez.7

Meta-aprendizado independente de modelo (MAML)

Como o próprio nome indica, esse algoritmo de meta-aprendizado baseado em otimização é independente de modelos. Isso o torna compatível com qualquer modelo treinado usando gradiente descendente e adequado para resolver vários problemas de aprendizado, como classificação, regressão e aprendizado por reforço.8

A ideia central por trás do MAML é treinar os parâmetros iniciais do modelo de modo que algumas atualizações de gradiente resultem em aprendizado rápido sobre uma nova tarefa. O objetivo é determinar os parâmetros do modelo que são sensíveis a alterações em uma tarefa, de modo que pequenas alterações nesses parâmetros levem a grandes melhorias na função de perda da tarefa. A meta-otimização entre tarefas é feita usando gradiente descendente estocástico (SGD).8

Ao contrário do gradiente descendente, que calcula derivadas para otimizar os parâmetros de um modelo para uma determinada tarefa, o MAML calcula derivadas de segunda ordem para otimizar os parâmetros iniciais de um modelo para a otimização específica da tarefa. Uma versão modificada do meta-aprendizado independente de modelo, conhecida como MAML de primeira ordem ou FOMAML, omite as derivadas de segunda ordem para um processo menos dispendioso em termos computacionais.8

Reptile

O Reptile é um algoritmo de meta-aprendizado baseado em gradiente de primeira ordem semelhante ao FOMAML. Ele coleta repetidamente amostras de uma tarefa, treina nessa tarefa por meio de várias etapas de gradiente descendente e migra o peso do modelo para os novos parâmetros.9