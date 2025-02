Également appelé réglage fin sélectif, les méthodes de réglage fin partiel visent à réduire les demandes de calcul en mettant à jour uniquement le sous-ensemble sélectionné de paramètres pré-entraînés les plus critiques pour modéliser les performances des tâches en aval pertinentes. Les paramètres restants sont « gelés », ce qui garantit qu’ils ne seront pas modifiés.

L’approche la plus intuitive du réglage fin partiel consiste à ne mettre à jour que les couches extérieures du réseau neuronal. Dans la plupart des architectures de modèles, les couches internes du modèle (les plus proches de la couche d’entrée) ne capturent que des caractéristiques générales et génériques : par exemple, dans un CNN utilisé pour la classification d’images, les premières couches discernent généralement les bords et les textures, chaque couche suivante discerne des caractéristiques de plus en plus fines jusqu’à ce que la classification finale soit prédite au niveau de la couche la plus externe. En règle générale, plus la nouvelle tâche (pour laquelle le modèle est finement réglé) est similaire à la tâche initiale, plus les poids pré-entraînés des couches internes seront utiles pour cette nouvelle tâche connexe – et donc moins il y aura de couches à mettre à jour.

D’autres méthodes de réglage fin partiel, notamment la seule mise à jour des termes de biais du modèle à l’échelle de la couche (plutôt que les poids spécifiques aux nœuds),4 et les méthodes de réglage fin « épars » qui ne mettent à jour qu’un sous-ensemble sélectionné de poids globaux dans l’ensemble du modèle.5