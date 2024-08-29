Los modelos de lenguaje enmascarado (MLM) son un tipo de modelos de lenguaje de gran tamaño (LLM) que se utiliza para ayudar a predecir las palabras que faltan en el texto en las tareas de procesamiento del lenguaje natural. Por extensión, el modelado de lenguaje enmascarado es una forma de entrenar modelos de transformadores, en particular representaciones de codificadores bidireccionales de transformadores (BERT) y su enfoque derivado de preentrenamiento BERT robustamente optimizado (RoBERTa), para tareas de PLN entrenando el modelo para rellenar palabras enmascaradas dentro de un texto , y así predecir las palabras más probables y coherentes para completar el texto. 1

El modelado del lenguaje enmascarado ayuda a muchas tareas, desde el análisis de sentimientos hasta la generación de texto, al entrenar a un modelo para que comprenda la relación contextual entre las palabras. De hecho, los desarrolladores de investigación suelen utilizar modelos en lenguaje enmascarado para crear modelos preentrenados que se someten a un mayor ajuste supervisado para tareas posteriores, como la clasificación de textos o la traducción automática. Los modelos de lenguaje enmascarados sustentan así muchos algoritmos de modelado de lenguaje de última generación actuales. Aunque el modelado de lenguaje enmascarado es un método para preentrenar modelos de lenguaje, las fuentes en línea a veces se refieren a él como un método de aprendizaje por transferencia. Esto podría no ser injustificado, ya que algunos grupos de investigación han comenzado a implementar el modelado del lenguaje enmascarado como una tarea final en sí misma.

Los transformadores HuggingFace y las bibliotecas de texto Tensorflow contienen funciones diseñadas para entrenar y probar modelos de lenguaje enmascarado en Python, tanto como tareas finales como para tareas posteriores.