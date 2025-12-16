AI 모델은 단순히 더 많은 데이터를 처리하는 것이 아니라, 레거시 시스템과 다른 방식으로 데이터를 처리합니다. 기존 소프트웨어에서 실수로 민감한 정보가 노출된 경우 엔지니어가 들어가서 코드를 디버깅할 수 있습니다. 하지만 AI 모델(ChatGPT와 같은 대규모 언어 모델 포함)은 코딩으로 만들어지는 것이 아니라 머신 러닝이라는 과정을 통해 진화하도록 만들어집니다. 제작자는 모델이 어떻게 작동하는지 정확히 알지 못하기 때문에 '디버깅'이란 불가능하지는 않더라도 사소한 일이 아닙니다.

우발적인 아웃풋도 우려되는 카테고리 중 하나지만, 조직은 고의적이고 악의적인 공격도 경계해야 합니다. 연구자들은 AI 툴에 영리한 해커가 악용할 수 있는 새로운 유형의 취약점이 있다는 사실을 입증했으며, 이를 적대적 머신 러닝이라고 합니다.

예를 들어, 최근 몇 년 동안 사이버 보안 전문가들은 AI 모델의 한 가지 단점, 즉 학습한 데이터에 응답할 때 아웃풋에 더 높은 신뢰도 점수가 부여된다는 점을 악용함으로써 악의적인 행위자가 특정 데이터가 학습 세트에 포함되어 있는지 추론할 수 있다는 사실을 입증했습니다. 특정 시나리오에서 이러한 추론은 중대한 프라이버시 침해가 될 수 있습니다. 예를 들어, HIV 양성 환자의 개인 의료 기록을 학습한 것으로 알려진 AI 모델을 생각해보세요.

잘 알려진 또 다른 예로, 연구자들은 단순히 데이터가 학습 세트에 있는지 여부를 추론하는 데 그치지 않았습니다. 그들은 모델 학습에 사용된 실제 데이터를 효과적으로 리버스 엔지니어링할 수 있는 알고리즘 공격을 만들었습니다. 연구원들은 '그래디언트'로 알려진 AI 모델의 한 측면을 활용하여 노이즈로 가득 찬 이미지를 반복적으로 개선하여 얼굴 인식 모델 학습에 사용된 실제 얼굴에 근접한 이미지로 만들 수 있었습니다. 2

데이터 보호에 대한 우려는 여전히 높습니다. IBM의 2025 데이터 유출 비용(CODB) 보고서에 따르면 이러한 침해로 인한 평균 비용은 440만 달러입니다. (이러한 침해는 회사 브랜드에 대한 대중의 신뢰 손상이라는 형태로 일어나, 비용을 정량화하기 어려운 결과도 초래합니다.)

이러한 데이터 침해 중 상당수는 AI와 관련이 없지만 점점 더 많아지고 있습니다. 스탠포드의 2025 AI 인덱스에 따르면 2024년에는 AI 프라이버시 및 보안 인시던트가 233건이 보고되어 1년 동안 56.4% 증가한 것으로 나타났습니다.3