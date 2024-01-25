일반적인 격언을 인용하자면, 모든 모델은 틀렸습니다. 통계, 과학, AI 분야에서도 마찬가지입니다. 도메인 전문 지식이 부족한 상태로 생성된 모델은 잘못된 아웃풋으로 이어질 수 있습니다.

오늘날에는 소수의 동질적인 그룹이 생성형 AI 모델을 학습하는 데 사용할 데이터를 결정하며, 이러한 데이터는 영어를 지나치게 많이 대표하는 소스에서 추출합니다. "전 세계 6,000개 이상의 언어 중 대부분의 경우 사용 가능한 텍스트 데이터로는 대규모 파운데이션 모델을 학습하기에 충분하지 않습니다."(출처: "On the Opportunities and Risks of Foundation Models", Bommasani 외, 2022).

추가로, 모델 자체도 제한된 아키텍처에서 만들어집니다. “거의 모든 최첨단 NLP 모델은 이제 BERT, RoBERTa, BART, T5 등과 같은 몇 가지 파운데이션 모델 중 하나를 기반으로 조정되고 있습니다. 이러한 동질화는 활용도가 매우 높지만(파운데이션 모델을 개선하면 모든 NLP에 즉각적인 이점을 제공할 수 있음), 약점이기도 합니다. 모든 AI 시스템이 몇 가지 파운데이션 모델의 문제가 되는 편향성을 물려받을 수 있기 때문입니다(Bommasani 외)”

생성형 AI가 서비스를 제공하는 다양한 커뮤니티를 더 잘 반영하려면 훨씬 더 다양한 인간 데이터가 모델에 표현되어야 합니다.

모델 정확도 평가는 편향성 평가와 밀접한 관련이 있습니다. 모델의 의도는 무엇이며 누구를 위해 최적화된 모델인지 질문해야 합니다. 예를 들어 콘텐츠 추천 알고리즘과 검색 엔진 알고리즘의 혜택을 가장 많이 받는 대상이 누구인지 생각해 보세요. 이해관계자는 서로 다른 관심사와 목표를 가질 수 있습니다. 알고리즘과 모델에는 모델이 개선해야 하는 최소 오차, 즉 베이즈 오차에 대한 목표 또는 프록시가 필요합니다. 이러한 프록시는 대개 해당 분야의 전문 지식을 갖춘 전문가와 같은 사람입니다.