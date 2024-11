Le pré-entraînement génératif est le processus d’entraînement d’un grand modèle de langage sur des données non étiquetées. Il permet au modèle d’apprendre à reconnaître diverses données et à affiner sa capacité à créer des prédictions précises. Les GPT génèrent de nouvelles données en appliquant les tendances et la structure de leurs données de pré-entraînement aux entrées de l’utilisateur.

Le pré-entraînement génératif est une forme d’apprentissage non supervisé, dans lequel le modèle est alimenté par des données non étiquetées et est obligé de les comprendre par lui-même. En apprenant à détecter des tendances dans des jeux de données non étiquetés, les modèles de machine learning sont en mesure de tirer des conclusions similaires lorsqu’ils sont exposés à de nouvelles entrées, telles qu’un prompt utilisateur dans ChatGPT.

Les modèles GPT sont entraînés avec des milliards, voire des trillions de paramètres : des variables internes qu’un modèle affine au cours du processus d’entraînement et qui déterminent son comportement. Bien que OpenAI n’ait pas encore révélé de détails précis sur GPT-4, on estime que le modèle contiendra environ 1,8 trillion de paramètres4, soit une multiplication par plus de dix par rapport à GPT-3.5.