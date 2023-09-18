기업의 AI 도입은 지난 5년 동안 두 배로 증가했으며, 오늘날 CEO들은 투자자, 채권자, 대출 기관 등으로부터 생성형 AI 도입을 가속화하라는 상당한 압박을 받고 있다고 밝히고 있습니다. 이는 AI 성숙도가 새로운 단계에 도달했다는 인식에서 비롯되며, 이를 통해 사회 전체에 이전보다 더 넓은 범위의 가능성, 결과, 그리고 비용상의 이점을 가져올 수 있게 되었습니다.
많은 기업들은 기술 내 특정 불확실성이 본질적인 신뢰를 약화시키기 때문에 AI에 ‘올인’하는 데 주저해 왔습니다. 그리고 보안은 일반적으로 이러한 불확실성 중 하나로 간주됩니다. AI 모델을 어떻게 보호할 수 있을까요? 데이터 도난, 조작 및 유출, 회피, 포이즈닝, 추출, 추론 공격 등 사이버 공격으로부터 이 혁신적인 기술을 어떻게 보호할 수 있을까요?
정부, 시장, 비즈니스 부문 등에서 AI 우위를 선점하기 위한 전 세계적인 경쟁은 이 질문에 답해야 한다는 압박과 긴급성을 불러왔습니다. AI 모델 보안 문제는 기본 데이터의 동적 특성과 방대한 양뿐만 아니라, AI 모델이 새롭게 도입하는 확장된 ‘공격 표면’에서도 발생합니다. 즉, 악의적인 목적을 위해 AI 모델이나 그 결과를 조작하려면 공격자가 시도할 수 있는 잠재적 진입점이 많으며, 그중 상당수는 아직 발견 중에 있습니다.
하지만 이 문제에 해결책이 없는 것은 아닙니다. 실제로 우리는 AI 보호를 위한 사상 최대의 크라우드소싱 운동을 경험하고 있습니다. 어떤 기술도 이보다 큰 움직임을 촉발한 적이 없습니다. Biden-Harris 행정부, DHS CISA, 유럽 연합의 AI 법은 연구, 개발자, 보안 커뮤니티를 결집시켜 AI의 보안, 개인정보 보호, 규정 준수를 공동으로 추진하고 있습니다.
AI 보안은 단순히 AI 자체를 보호하는 것보다 훨씬 광범위하다는 점을 이해하는 것이 중요합니다. 즉, AI를 보호할 때 모델과 데이터만을 고려해서는 안 됩니다. 또한 AI가 내장되어 방어 메커니즘으로 작동하는 엔터프라이즈 애플리케이션 스택도 고려해야 하며, 이를 통해 AI에 대한 보호를 확장할 수 있습니다. 같은 맥락에서 조직의 인프라가 공격자에게 AI 모델에 접근할 수 있는 위협 벡터로 작용할 수 있으므로, 전체 환경을 안전하게 보호해야 합니다.
데이터, 모델, 애플리케이션, 전체 프로세스 등 AI를 보호하기 위한 다양한 수단을 이해하려면, AI가 작동하는 방식뿐만 아니라 다양한 환경에서 어떻게 배포되는지 정확히 파악해야 합니다.
조직의 인프라는 AI 모델에 가하는 위협에 대한 첫 번째 방어 계층입니다. AI를 둘러싼 광범위한 IT 인프라에 적절한 보안 및 개인정보 보호 제어 기능이 내장되어 있는지 확인하는 것이 핵심입니다. 이 영역에서 업계는 이미 상당한 이점을 가지고 있습니다. 우리는 오늘날의 복잡하고 분산된 환경에서 최적의 보안, 개인정보 보호, 규정 준수 표준을 확립하는 데 필요한 노하우와 전문 지식을 갖추고 있습니다. 또한 이러한 일상적인 임무가 안전한 AI를 가능하게 하는 역할을 한다는 점도 인식하는 것이 중요합니다.
예를 들어 사용자, 모델, 데이터에 대한 안전한 액세스를 가능하게 하는 것이 가장 중요합니다. 기존 제어를 사용하고 이러한 관행을 AI 모델에 대한 경로 보안으로 확장해야 합니다. 비슷한 맥락에서 AI는 엔터프라이즈 애플리케이션 전반에 걸쳐 새로운 가시성 차원을 제공하므로 위협 탐지 및 대응 기능을 AI 애플리케이션으로 확장해야 합니다.
공급망 전반에서 안전한 전송 방법을 적용하고, 엄격한 접근 제어와 인프라 보호를 구축하며, 가상 머신과 컨테이너의 관리 및 보안 위생을 강화하는 등 테이블 스테이크(Table stake) 수준의 보안 표준은 악용을 방지하는 핵심입니다. 전반적인 기업 보안 전략을 검토할 때, 이러한 프로토콜, 정책, 보안 위생, 표준을 조직의 AI 프로필에도 동일하게 적용해야 합니다.
AI 라이프사이클 관리 요구 사항은 아직 명확하게 정립되지 않았지만, 조직은 기존 가드레일을 활용해 AI 여정을 안전하게 관리할 수 있습니다. 예를 들어, 투명성과 설명 가능성은 편향, 할루시네이션, 데이터 중독(poisoning) 공격을 방지하는 데 필수적이므로, AI 도입자는 모델의 정확성과 성능을 위해 워크플로, 학습 데이터, 산출물을 감사하는 프로토콜을 수립해야 합니다. 또한 신뢰와 투명성을 위해 데이터의 출처와 준비 과정을 문서화해야 합니다. 이러한 맥락과 명확성은 데이터에서 나타날 수 있는 이상 징후를 조기에 감지하는 데 도움을 줍니다.
보안은 AI 개발 및 배포 단계 전반에 걸쳐 유지되어야 하며, 여기에는 학습 및 테스트 데이터 단계에서 개인정보 보호 및 보안 조치를 적용하는 것이 포함됩니다. AI 모델은 기본 데이터를 기반으로 지속적으로 학습하기 때문에 이러한 역동성을 고려하고 데이터 정확도의 잠재적 위험을 파악하여, 데이터 라이프사이클 전반에 걸쳐 테스트 및 검증 단계를 통합하는 것이 중요합니다. 프롬프트와 API를 통해 발생할 수 있는 SPI, PII, 규제 대상 데이터 유출을 감지하고 방지하기 위해 데이터 손실 방지(DLP) 기술도 필수적입니다.
AI를 보호하려면 AI 프로젝트를 구축, 배포, 관리하는 통합된 접근 방식이 필요합니다. 이는 규제 요구 사항을 지원하는 거버넌스, 투명성, 윤리를 갖춘 AI를 구축하는 것을 의미합니다. 조직은 AI 도입을 모색할 때 AI 모델 및 학습 데이터 세트와 관련된 오픈 소스 공급업체의 정책 및 관행은 물론 AI 플랫폼의 성숙도 상태를 평가해야 합니다. 또한 데이터 사용 및 보존에 대해서도 고려해야 합니다. 즉 데이터가 언제, 어디서, 어떻게 사용될지 정확히 파악하고 데이터 저장 기간을 제한하여 개인정보 보호 문제와 보안 위험을 최소화해야 합니다. 아울러 구매팀은 수립되는 모든 AI 정책의 기반이 될 수 있도록 현재 기업의 개인정보 보호, 보안 및 규정 준수 정책과 가이드라인에 부합하는지 확인하는 과정에 참여해야 합니다.
AI 수명 주기를 보호하려면 AI 모델과 애플리케이션을 구축하고 배포하는 과정에서 ML을 포함하도록 기존 DevSecOps 프로세스를 강화해야 합니다. AI 모델과 학습 데이터 처리에도 특별한 주의를 기울여야 합니다. AI를 사전 배포 단계에서 학습시키고, 버전을 지속적으로 관리하는 것은 지속적인 학습과 함께 시스템 무결성을 처리하는 데 핵심입니다. 또한 프롬프트와 AI 모델에 접근하는 사용자 활동을 모니터링하는 것도 중요합니다.
이 가이드가 AI 보안을 완전히 다루는 포괄적인 지침은 아니지만, AI 보안에 대한 오해를 바로잡고자 하는 목적에서 작성되었습니다. 실제로 우리는 AI를 안전하게 배포하기 위해 활용할 수 있는 다양한 도구, 프로토콜, 전략을 이미 보유하고 있습니다.
AI 도입이 확대되고 혁신이 발전함에 따라 보안 지침도 수년에 걸쳐 기업 구조에 내장된 모든 기술의 경우와 마찬가지로 성숙해질 것입니다. 아래에서는 조직이 환경 전반에 걸쳐 AI를 안전하게 배포할 수 있도록 준비하는 데 도움이 되는 IBM의 몇 가지 모범 사례를 공유합니다.
