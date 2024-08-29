Os modelos de linguagem mascarados (MLM) são um tipo de grandes modelos de linguagem (LLM) usado para ajudar a prever palavras ausentes no texto em tarefas de processamento de linguagem natural (NLP). Por extensão, a modelagem em linguagem mascarada é uma forma de treinar modelos de transformadores, notavelmente representações de codificadores bidirecionais de transformadores (BERT) e sua abordagem de pré-treinamento de BERT robustamente otimizada (RoBERTa) para tarefas de PLN, treinando o modelo para preencher palavras mascaradas dentro de um texto. e, assim, prever as palavras mais prováveis e coerentes para completar o texto.1

A modelagem de linguagem mascarada auxilia em diversas tarefas — da análise de sentimentos à geração de texto— treinando um modelo para compreender a relação contextual entre as palavras. Na verdade, os desenvolvedores de pesquisa geralmente usam a modelagem de linguagem mascarada para criar modelos pré-treinados que passam por um ajuste fino supervisionado adicional para tarefas posteriores, como classificação de texto ou tradução automática. Os modelos de linguagem mascarados são, portanto, a base de muitos algoritmos de modelagem de linguagem atuais de última geração. Embora a modelagem de linguagem mascarada seja um método de pré-treinamento de modelos de linguagem, as fontes on-line às vezes se referem a ela como um método de aprendizagem por transferência. Isso pode não ser injustificado, já que alguns grupos de pesquisa começaram a implementar a modelagem de linguagem mascarada como uma tarefa final por si só.

Os transformadores HuggingFace e as bibliotecas de texto Tensorflow contêm funções projetadas para treinar e testar modelos de linguagem mascarados em Python, tanto como tarefas finais quanto para tarefas posteriores.