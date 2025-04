Les modèles Transformer, tels que les transformers génératifs préentraînés (GPT) d’OpenAI, servent de base aux petits modèles de langage (SLM) et aux grands modèles de langage (LLM). Les transformers traitent les données à l’aide d’encodeurs et de décodeurs.

Les encodeurs transforment les séquences d’entrée en représentations numériques appelées plongements qui capturent la sémantique et la position des tokens dans la séquence d’entrée. Un mécanisme d’auto-attention permet aux transformers de « concentrer leur attention » sur les tokens les plus importants de la séquence d’entrée, quelle que soit leur position. Les décodeurs utilisent ensuite ce mécanisme d’auto-attention et les plongements des encodeurs pour générer la séquence de sortie la plus statistiquement probable.

Les modèles Transformer excellent dans la compréhension de la structure et des schémas du langage. De ce fait, ils peuvent être utilisés pour créer des données textuelles artificielles ou générer des données synthétiques tabulaires.