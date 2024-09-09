Microsoft 연구팀은 이 언러닝 접근을 활용해, 인터넷에서 학습된 해리 포터의 저작권 있는 내용을 Meta의 Llama2-7b 모델이 잊게 만들 수 있는지 실험했습니다. 언러닝 이전에는, 연구자가 “Who is Harry Potter?”와 같은 프롬프트를 입력하면 모델은 “Harry Potter is the main protagonist in J.K. Rowling’s series of fantasy novels.”라고 응답했습니다.

미세 조정을 통해 모델이 저작권이 있는 자료를 “잊도록” 만들고 난 후, 동일한 프롬프트에 대해 모델은 다음과 같이 응답했습니다. “Harry Potter는 영국의 배우이자 작가, 그리고 감독입니다…”.

연구자인 Ronen Elden과 Mark Russinovich는 블로그 글에서 “본질적으로 모델이 대상 데이터와 관련된 문맥을 만날 때마다 원래 내용을 ‘잊어버립니다.’”라고 설명했습니다. 연구팀은 Hugging Face에 모델을 공개해 AI 커뮤니티가 언러닝을 탐구하고 실험할 수 있도록 했습니다.

저작권 자료 제거뿐 아니라 개인의 프라이버시를 보호하기 위해 민감한 자료를 제거하는 것도 중요한 활용 사례입니다. 텍사스대학교 오스틴 캠퍼스의 Radu Marculescu가 이끄는 연구팀은 JP Morgan Chase의 AI 전문가들과 협력해 이미지-투-이미지 생성 모델을 위한 머신 언러닝 연구를 진행하고 있습니다. 최근 발표한 논문에서 연구팀은 전체 이미지 성능을 저하시키지 않고 이미지의 원치 않는 요소(‘forget set’)를 제거할 수 있음을 입증했습니다.

Marculescu 교수는 이러한 기술이 부동산 현장을 드론으로 조사하는 경우 등에서 도움이 될 수 있다고 말했습니다. “예를 들어 어린이 얼굴이 선명하게 찍혀 있다면, 해당 부분을 제거해 프라이버시를 보호할 수 있습니다.”

Google 또한 더 넓은 오픈소스 개발자 커뮤니티에서 언러닝 문제를 해결하기 위해 적극적으로 노력하고 있습니다. Google은 2023년 6월 첫 머신 언러닝 챌린지를 개최했습니다. 이 대회는 얼굴 이미지로 학습된 연령 예측 모델을 사용했습니다. 학습 후, 개인정보 보호 또는 관련 인물의 권리를 위해 학습 이미지 중 특정 부분을 모델이 ‘잊도록’ 해야 했습니다.

완벽하진 않지만 여러 팀의 초기 결과는 매우 고무적입니다. 예를 들어 IBM의 Baracaldo 팀은 Llama 모델에 머신 언러닝을 적용해 정확도 손실 없이 독성 점수를 15.4%에서 4.8%로 낮추는 데 성공했습니다. 그리고 모델을 다시 학습하는 데 수개월과 막대한 비용이 드는 것과 달리, 언러닝은 단 224초만에 완료되었습니다.