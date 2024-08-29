마스킹된 언어 모델(MLM)은 자연어 처리(NLP) 작업에서 텍스트의 누락된 단어를 예측하는 데 사용되는 대규모 언어 모델(LLM)의 한 유형입니다. 확장해 말하자면, 마스킹된 언어 모델링은 텍스트 내에서 마스킹된 단어를 채우도록 모델을 학습시킴으로써, 문장을 가장 자연스럽고 일관되게 완성할 가능성이 높은 단어를 예측하도록 하는 방식으로, 트랜스포머 모델—특히 BERT(Bidirectional Encoder Representations from Transformers)와 그 변형인 RoBERTa(Robustly Optimized BERT Pretraining Approach)—을 NLP 작업에 맞게 학습시키는 방법 중 하나입니다.1

마스킹된 언어 모델링은 단어 간의 문맥 관계를 이해하도록 모델을 훈련시켜 감정 분석에서 텍스트 생성에 이르기까지 다양한 작업을 지원합니다. 실제로 연구 개발자들은 텍스트 분류나 기계 번역과 같은 다운스트림 작업을 위해 사전 학습된 모델을 만들고 감독을 거쳐 미세 조정하는 데 마스킹된 언어 모델링을 사용하는 경우가 많습니다. 따라서 마스킹된 언어 모델은 현재 많은 최신 언어 모델링 알고리즘의 기반이 됩니다. 마스킹된 언어 모델링은 언어 모델을 사전 학습하는 방법이지만, 온라인 자료에서는 이를 전이 학습 방법이라고 부르기도 합니다. 일부 연구 그룹은 마스킹된 언어 모델링을 그 자체로 최종 과제로 구현하기 시작했기 때문에 이는 정당화되지 않을 수 있습니다.

HuggingFace 트랜스포머 및 Tensorflow 텍스트 라이브러리에는 Python에서 마스킹된 언어 모델을 학습하고 테스트하도록 설계된 함수가 포함되어 있습니다.