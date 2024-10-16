우리가 항상 의식적으로 인식하고 있지는 않더라도 인공 지능은 이제 우리 주변에 존재하고 있습니다. 우리는 이미 전자 상거래의 맞춤형 추천 시스템, 대화형 AI로 구동되는 고객 서비스 챗봇 등에 익숙해졌습니다. 정보 보안 영역에서는 이미 수년 전부터 AI 기반 스팸 필터를 사용하여 악성 이메일로부터 사용자를 보호하고 있습니다.
위 사례는 모두 잘 정립된 사용 사례입니다. 하지만 지난 몇 년 동안 생성형 AI가 급부상한 이후 기계는 훨씬 더 많은 일을 할 수 있게 되었습니다. 위협 탐지부터 사고 대응 자동화, 모의 피싱 이메일을 통한 직원 인식 테스트에 이르기까지 사이버 보안에서 AI의 기회는 의심의 여지가 없습니다.
그러나 새로운 기회에는 새로운 위험이 따릅니다. 위협 행위자들은 이제 AI를 사용하여 이전에는 불가능했던 규모로 더욱 설득력 있는 피싱 공격을 시작하고 있습니다. 위협에 앞서 나가기 위해서는 방어 전선에 있는 사람들도 AI가 필요하지만, 그레이 햇 전술의 영역으로 들어가지 않도록 윤리에 중점을 두고 투명하게 사용해야 합니다.
이제 정보 보안 리더가 책임감 있는 AI 전략을 채택해야 할 때입니다.
범죄는 인간의 문제이며 사이버 범죄도 다르지 않습니다. 생성형 AI를 비롯한 기술은 공격자의 무기고에 있는 또 다른 도구일 뿐입니다. 합법적인 기업은 인터넷에서 스크랩한 방대한 양의 데이터를 사용하여 AI 모델을 학습시킵니다. 이러한 모델은 수백만 명의 실제 사람들의 창의적인 노력에 대해 훈련되는 경우가 많을 뿐만 아니라, 의도적이든 비의도적이든 공개 도메인에 있는 개인정보를 유출할 가능성이 있습니다. 그 결과, 대형 AI 모델 개발자 중 일부는 현재 소송에 직면하고 있으며, 업계 전반은 규제 기관의 관심이 커지고 있습니다.
위협 행위자는 AI 윤리에 거의 신경 쓰지 않지만, 합법적인 기업도 자신도 모르게 같은 일을 저지르기 쉽습니다. 예를 들어 웹 스크래핑 도구를 사용하여 피싱 콘텐츠를 탐지하는 모델을 만들기 위해 학습 데이터를 수집할 수 있습니다. 그러나 이러한 도구는 특히 이미지 콘텐츠의 경우 개인정보와 익명화된 정보를 구분하지 못할 수 있습니다. 이미지의 경우 LAION이나 텍스트의 경우 The Pile과 같은 오픈 소스 데이터 세트에도 비슷한 문제가 있습니다. 예를 들어, 2022년 캘리포니아의 한 아티스트는 의사가 촬영한 개인 의료 사진이 인기 있는 오픈 소스 이미지 합성기 Stable Diffusion을 학습하는 데 사용되는 LAION-5B 데이터 세트에 포함되었다는 사실을 발견했습니다.
사이버 보안 분야에 특화된 AI 모델을 부주의하게 개발하면, 아예 AI를 사용하지 않는 것보다 더 큰 위험을 초래할 수 있다는 점은 부정할 수 없습니다. 이를 방지하기 위해 보안 솔루션 개발자는 특히 기밀 정보를 익명화하거나 보호하는 데 있어 최고 수준의 데이터 품질과 개인정보 보호 기준을 유지해야 합니다. 유럽의 일반 데이터 보호 규정(GDPR)과 캘리포니아 소비자 개인정보 보호법(CCPA)과 같은 법률은 생성형 AI가 등장하기 전에 개발되었지만 윤리적 AI 전략을 알리는 데 유용한 가이드라인 역할을 합니다.
업계 뉴스레터
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
기업들은 생성형 AI가 등장하기 훨씬 전부터 보안 위협과 취약성을 탐지하기 위해 머신 러닝을 사용해 왔습니다. 자연어 처리(NLP), 행동 및 감정 분석, 딥 러닝으로 구동되는 시스템은 모두 이러한 사용 사례에서 잘 확립되어 있습니다. 그러나 이들 역시 개인정보 보호와 보안이 서로 경쟁하는 분야가 될 수 있는 윤리적 난제를 안고 있습니다.
예를 들어, 내부자 위협을 탐지하기 위해 AI를 사용하여 직원의 검색 기록을 모니터링하는 회사를 생각해 보세요. 이렇게 하면 보안이 강화되지만, 의료 검색이나 금융 거래와 같이 직원들이 비공개로 유지하기를 원하는 개인 검색 정보를 캡처하는 일도 발생할 수 있습니다.
개인정보 보호는 물리적 보안의 문제이기도 합니다. 예를 들어, AI 기반 지문 인식은 민감한 사이트나 디바이스에 대한 무단 액세스를 방지할 수 있지만, 매우 민감한 생체 데이터를 수집하기 때문에 유출될 경우 해당 개인에게 장기적인 문제를 야기할 수 있습니다. 결국 지문 데이터가 해킹당하면 새로운 손가락을 얻을 수 없습니다. 그렇기 때문에 생체 인식 시스템은 최대한의 보안을 유지하고 책임감 있는 데이터 보존 정책을 통해 백업하는 것이 필수적입니다.
AI에 대해 기억해야 할 가장 중요한 점은 사람과 마찬가지로 다양한 방식으로 실수할 수 있다는 것입니다. 윤리적 AI 전략을 도입할 때 중심이 되는 과제 중 하나는 TEVV, 즉 테스트·평가·검증·확인(Testing, Evaluation, Validation and Verification)입니다. 사이버 보안과 같은 미션 크리티컬한 영역에서는 더욱 그렇습니다.
AI에 수반되는 많은 위험은 개발 과정에서 나타납니다. 예를 들어, 학습 데이터는 품질 보증과 조작되지 않았는지 확인하기 위해 철저한 TEVV를 거쳐야 합니다. 데이터 포이즈닝은 이제 더 정교한 사이버 범죄자들이 가장 많이 사용하는 공격 벡터 중 하나이기 때문에 이는 매우 중요합니다.
사람들과 마찬가지로 AI에 내재된 또 다른 문제는 편향성과 공정성입니다. 예를 들어, 악성 이메일에 플래그를 지정하는 데 사용되는 AI 도구는 특정 문화 집단과 일반적으로 연관된 언어의 징후를 보인다는 이유로 정상적인 이메일을 표적으로 삼을 수 있습니다. 이로 인해 특정 그룹을 불공정하게 프로파일링하고 타겟팅하여 부당한 조치가 취해질 수 있다는 우려가 제기됩니다.
AI의 목적은 인간의 지능을 대체하는 것이 아니라 보강하는 것입니다. 문제가 발생해도 기계는 책임을 질 수 없습니다. AI는 인간이 훈련시킨 대로 한다는 것을 기억하는 것이 중요합니다. 이 때문에 AI는 인간의 편견과 잘못된 의사 결정 프로세스를 물려받습니다. 또한 많은 AI 모델의 '블랙박스' 특성으로 인해 최종 사용자가 AI가 어떤 결정을 내리는지 알 수 없기 때문에 이러한 문제의 근본 원인을 파악하는 것이 매우 어렵습니다. 이러한 모델에는 AI 주도 의사 결정에서 투명성과 책임성을 확보하는 데 중요한 설명성이 부족합니다.
사이버 보안이든 다른 어떤 맥락에서든 AI를 개발하거나 활용하든, 프로세스 전반에 걸쳐 인간을 중심에 두는 것이 필수적입니다. 훈련 데이터는 다양하고 포용적인 팀에 의해 정기적으로 감사되어야 하며, 편견과 잘못된 정보를 줄이기 위해 정제되어야 합니다. 사람 역시 같은 문제에 빠지기 쉽지만, 지속적인 감독과 AI가 어떻게 결론을 도출하는지 설명할 수 있는 능력이 있다면 이러한 위험을 크게 완화할 수 있습니다.
반면, AI를 단순히 지름길이자 인간을 대체할 수 있는 존재로만 생각하면 AI는 필연적으로 자신의 단점만 증폭시킬 정도로 스스로 학습하여 자신의 방식으로 진화할 수밖에 없는데, 이를 'AI 드리프트'라고 합니다.
AI를 보호하고 도입 및 사용에 대한 책임을 지는 인간의 역할은 아무리 강조해도 지나치지 않습니다. 그렇기 때문에 기업은 인력을 줄이고 비용을 절감하기 위한 방법으로 AI에 집중하는 대신, 절감된 금액을 투자하여 팀을 재교육하고 새로운 AI 관련 직무로 전환해야 합니다. 즉, 모든 정보 보안 전문가는 윤리적인 AI 사용(그리고 사람)을 최우선으로 생각해야 합니다.