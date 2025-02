HellaSwag는 “Harder Endings, Longer contexts and Low-shot Activities for Situations With Adversarial Generations”의 줄임말입니다. 이 벤치마크는 상식적인 추론과 자연어 추론에 중점을 두고 있습니다. 모델은 여러 가지 가능한 어미 중에서 선택하여 문장을 완성하는 과제를 수행합니다. 이 결과에는 사실적이지만 기만적인 오답을 생성하는 알고리즘인 적대적 필터링을 통해 생성된 오답이 포함됩니다. HellaSwag는 퓨샷과 제로샷 범주 모두에 대해 정확도를 평가합니다.4