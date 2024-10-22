조직에는 생성형 AI를 활용하는 완전히 새로운 프로젝트 파이프라인이 구축되고 있습니다. 데이터 수집 및 처리 단계에서는 모델에 공급하기 위해 대량의 데이터를 수집해야 하며 데이터 과학자, 엔지니어, 개발자 등 다양한 사람들에게 액세스 권한을 제공해야 합니다. 이는 모든 데이터를 한 곳에 중앙 집중화하고 많은 사람들이 데이터에 액세스할 수 있게 함으로써 본질적으로 위험을 초래합니다. 즉, 생성형 AI는 기존 조직 데이터를 기반으로 새로운 데이터를 생성할 수 있는 새로운 유형의 데이터 저장소입니다. 모델을 학습시키든, 미세 조정하든, RAG(벡터 DB)에 연결하든, 해당 데이터에는 PII, 개인정보 보호 문제 및 기타 민감한 정보가 포함되어 있을 수 있습니다. 이 민감한 데이터 더미는 공격자들이 접근을 시도하는 빨간 불이 깜박이는 표적입니다.

모델 개발 과정에서 새로운 애플리케이션이 새로운 취약점을 가진 새로운 방식으로 구축되고 있으며, 이는 공격자가 악용할 수 있는 새로운 진입점이 됩니다. 개발은 종종 HuggingFace나 TensorFlow Hub와 같은 온라인 모델 저장소에서 사전 학습된 오픈 소스 머신 러닝 모델을 다운로드하고 재활용하는 데이터 과학 팀에서 시작됩니다. 오픈 소스 모델 공유 리포지토리는 내재된 데이터 과학의 복잡성, 실무자 부족, 생성형 AI 도입에 필요한 시간과 노력을 획기적으로 줄여 조직에 제공하는 가치로 인해 탄생했습니다. 그러나 이러한 리포지토리에는 포괄적인 보안 제어 기능이 부족할 수 있으며, 이는 궁극적으로 기업에 위험을 전가할 수 있으며, 공격자들은 이를 신뢰하고 있습니다. 이러한 모델 중 하나에 백도어나 멀웨어를 주입하고 감염된 모델을 모델 공유 리포지토리에 다시 업로드하여 모델을 다운로드하는 모든 사람에게 영향을 미칠 수 있습니다. ML 모델에 대한 보안이 전반적으로 부족하고 ML 모델에 노출되는 데이터가 점점 더 민감해지면서 이러한 모델을 표적으로 하는 공격이 피해를 입힐 가능성이 높습니다.

또한 추론 및 실시간 사용 중에 공격자는 프롬프트를 조작하여 가드레일을 탈옥하고 편향된, 허위 및 기타 유해한 정보를 포함하는 유해한 프롬프트에 대해 허용되지 않는 응답을 생성하여 모델 오작동을 유도하고 평판에 피해를 줄 수 있습니다. 또는 공격자가 모델을 조작하고 입력-아웃풋 쌍의 분석을 통해 대리 모델을 학습시켜 대상 모델의 동작을 모방함으로써 해당 모델의 기능을 효과적으로 '도용'하고 기업의 경쟁 우위를 빼앗을 수 있습니다.