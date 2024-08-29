Los modelos de lenguaje enmascarado (MLM) son un tipo de modelo de lenguaje grande (LLM) utilizado para ayudar a predecir palabras faltantes del texto en tareas de procesamiento del lenguaje natural (PNL). Por extensión, el modelado de lenguaje enmascarado es una forma de entrenar modelos transformadores—en particular, las representaciones de codificadores bidireccionales de transformadores (BERT) y su enfoque derivado de preentrenamiento BERT optimizado de forma robusta (RoBERTa)— para tareas de PLN, entrenando al modelo para que rellene las palabras enmascaradas dentro de un texto y, de ese modo, prediga las palabras más probables y coherentes para completar el texto.

El modelado de lenguaje enmascarado ayuda a muchas tareas, desde el análisis de sentimientos hasta la generación de texto, al entrenar un modelo para comprender la relación contextual entre las palabras. De hecho, los desarrolladores de investigación a menudo utilizan modelos de lenguaje enmascarado para crear modelos preentrenados que se someten a un ajuste adicional supervisado para tareas posteriores, como la clasificación de texto o la traducción automática. Los modelos de lenguaje enmascarados sustentan así muchos algoritmos de modelado de lenguaje de última generación actuales. Aunque el modelado de lenguaje enmascarado es un método para preentrenar modelos de lenguaje, las fuentes en línea a veces se refieren a él como un método de aprendizaje por transferencia. Esto podría no ser injustificado, ya que algunos grupos de investigación han comenzado a implementar el modelado de lenguaje enmascarado como una tarea final en sí misma.

Los transformadores HuggingFace y las bibliotecas de texto Tensorflow contienen funciones diseñadas para entrenar y probar modelos de lenguaje enmascarado en Python, tanto como tareas finales como para tareas posteriores.