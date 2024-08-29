Les modèles de langage masqué (MLM) sont un type de grands modèles de langage (LLM) utilisé pour prédire les mots manquants dans un texte lors des tâches de traitement automatique du langage naturel (TAL). Par extension, la modélisation du langage masqué est une forme d’entraînement des modèles de type Transformer, notamment les représentations d’encodeur bidirectionnelles issues de transformers (BERT) et son approche dérivée de pré-entraînement BERT robustement optimisée (RoBERTa), pour les tâches de traitement automatique du langage naturel (TAL). Il s’agit d’entraîner le modèle à compléter les mots masqués dans un texte, et ainsi prédire les mots les plus probables et cohérents pour compléter le texte.1

La modélisation du langage masqué facilite de nombreuses tâches, de l’analyse des sentiments à la génération de textes, en entraînant un modèle qui comprend la relation contextuelle entre les mots. En fait, les développeurs chercheurs utilisent souvent la modélisation du langage masqué pour créer des modèles pré-entraînés qui font l’objet d’un réglage fin supervisé supplémentaire pour les tâches en aval telles que la classification des textes ou la traduction automatique. Les modèles de langage masqué sous-tendent ainsi de nombreux algorithmes de modélisation du langage de pointe. Bien que la modélisation du langage masqué soit une méthode de pré-entraînement des modèles de langage, les sources en ligne la désignent parfois comme une méthode d’apprentissage par transfert. Cela est discutable car certains groupes de recherche ont commencé à mettre en œuvre la modélisation du langage masqué comme une finalité en soi.

Les transformers HuggingFace et les bibliothèques de texte Tensorflow contiennent des fonctions conçues pour entraîner et tester les modèles de langage masqué en Python, en tant que tâches finales et en aval.