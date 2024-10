Meta learning basato sull'ottimizzazione

Il deep learning richiede in genere più aggiornamenti iterativi dei parametri del modello attraverso la retropropagazione e l'algoritmo di ottimizzazione della discesa del gradiente . Nel meta learning basato sull'ottimizzazione, noto anche come meta learning basato sul gradiente, l'algoritmo apprende quali parametri iniziali del modello o iperparametri delle reti neurali profonde possono essere ottimizzati in modo efficiente per compiti pertinenti. In questo caso si parla di solito di meta-ottimizzazione, ovvero l'ottimizzazione dell'algoritmo di ottimizzazione stesso.

LSTM meta-learner

Questo metodo di meta learning basato sull'ottimizzazione utilizza una popolare architettura di rete neurale ricorrente chiamata long-short term memory (LSTM) per addestrare un meta-learner ad acquisire sia conoscenze a lungo termine condivise tra i compiti, sia conoscenze a breve termine da ciascun compito. Il meta-learner ottimizza quindi un altro classificatore di reti neurali. Apprende un'inizializzazione dei parametri del learner per una rapida convergenza durante l'addestramento e come aggiornare quei parametri in modo efficiente data una piccola quantità di dati di addestramento, aiutando il modello ad adattarsi rapidamente a nuovi compiti.7

Model-agnostic meta learning (MAML)

Come suggerisce il nome, questo algoritmo di meta learning basato sull'ottimizzazione è indipendente dal modello. Ciò lo rende compatibile con qualsiasi modello addestrato utilizzando la discesa del gradiente e adatto a risolvere vari problemi di apprendimento, come la classificazione, la regression e l'apprendimento per rinforzo.8

L'idea fondamentale alla base di MAML è quella di addestrare i parametri iniziali del modello in modo che alcuni aggiornamenti del gradiente determinino un rapido apprendimento di un nuovo compito. L'obiettivo è determinare parametri del modello che siano sensibili ai cambiamenti in un compito in modo che piccole modifiche a quei parametri portino a grandi miglioramenti nella funzione di perdita del compito. La meta-ottimizzazione tra le attività viene eseguita utilizzando la discesa stocastica del gradiente (SGD).8

A differenza della discesa del gradiente, che calcola le derivate per ottimizzare i parametri di un modello per un compito specifico, MAML calcola le derivate seconde per ottimizzare i parametri iniziali di un modello per un'ottimizzazione specifica del compito. Una versione modificata del model-agnostic meta learning, nota come MAML di primo ordine o FOMAML, omette le derivate seconde per un processo meno costoso dal punto di vista computazionale.8

Reptile

Reptile è un algoritmo di meta learning basato sul gradiente di primo ordine simile a FOMAML. Campiona ripetutamente un compito, esegue l'addestramento su quel compito attraverso molti passaggi di discesa del gradiente e sposta i pesi del modello verso i nuovi parametri.9