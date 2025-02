Le réglage des instructions est un sous-ensemble de la catégorie plus large des techniques de réglage fin utilisées pour adapter les modèles de fondation pré-entraînés aux tâches en aval. Les modèles de fondation peuvent être affinés à des fins diverses, qu’il s’agisse de personnaliser le style, de compléter les connaissances de base et le vocabulaire du modèle pré-entraîné ou d’optimiser les performances pour un cas d’utilisation spécifique. Bien que le réglage ne soit pas réservé à un domaine en particulier ou à l’architecture d’un modèle d’intelligence artificielle, il fait désormais partie intégrante du cycle de vie du LLM. Par exemple, la famille de modèles Llama 2 de Meta est proposée (en plusieurs tailles) en tant que modèle de base, en tant que variante optimisée pour le dialogue (Llama-2-chat) et en tant que variante affinée pour le codage (Code Llama).

Le réglage des instructions n’est pas incompatible avec les autres techniques de réglage fin. Par exemple, les modèles de chat font souvent l’objet d’un réglage d’instructions et l’apprentissage par renforcement basé sur les commentaires humains (RLHF), une technique d’optimisation qui vise à améliorer des qualités abstraites telles que la serviabilité et l’honnêteté. Les modèles réglés pour le codage subissent souvent à la fois un réglage d’instructions (pour optimiser largement les réponses pour les instructions suivantes) et un réglage supplémentaire des données spécifiques à la programmation (pour augmenter les connaissances du modèle en matière de syntaxe et de vocabulaire de codage).

Alors que la genèse des LLM remonte à l’article « Attention is All You Need » de 2017 qui a introduit des modèles de transformeurs à grande échelle dans les tâches de traitement automatique du langage naturel (NLP) , l’incorporation du réglage des instructions et du RLHF,sous l’influence d’articles de Google (en 2021)1 et OpenAI (en 2022),2 ont respectivement donné naissance aux LLM modernes qui ont ouvert la porte à l’ère actuelle de l’ IA générative avec le lancement de ChatGPT.