掩码语言模型 (MLM) 是一种大语言模型 (LLM)，用于在自然语言处理 (NLP) 任务中帮忙预测文本中缺失的单词。推而广之，掩码语言建模是一种针对 Transformer 模型的训练方法，典型代表为 Transformer 双向编码器表征 (BERT) 及其衍生的优化稳健型 BERT 预训练方法 (RoBERTa)。该方法通过训练模型补全文本中的掩码单词，预测出最合理且语义连贯的词汇以完成文本，从而处理 NLP 任务。1

掩码语言建模通过训练模型理解单词之间的上下文关系，从而帮助完成从情感分析到文本生成的一系列任务。事实上，研发人员经常使用掩码语言建模来构建预训练模型，这些模型会经过进一步的监督微调，以用于处理文本分类或机器翻译等下游任务。因此，掩码语言模型为当前的许多先进语言建模算法奠定了基础。尽管掩码语言建模是一种语言模型预训练方法，但网上资料有时将其称为迁移学习方法。这或许并非毫无道理，因为一些研究小组已经开始将掩码语言建模作为最终任务来实现。

HuggingFace 转换器与 TensorFlow 文本库包含专为 Python 环境训练和测试掩码语言模型设计的函数，既支持终端任务也适用于下游任务。