코넬 테크, 이스라엘 공과대학교, Intuit의 연구원들은 '적대적 자가 복제 프롬프트'를 사용하여 이 웜을 만들었습니다. 이 프롬프트는 대규모 언어 모델(LLM)에 입력되면(OpenAI의 ChatGPT, Google의 Gemini 및 위스콘신-매디슨 대학교, Microsoft Research, 컬럼비아 대학교의 연구원들이 개발한 오픈 소스 LLaVA 모델에서 테스트 진행) 해당 모델을 속여 추가 프롬프트를 생성하도록 만듭니다. 그러면 챗봇이 악성 프롬프트를 생성하도록 트리거되고, 응답을 위해 해당 명령을 수행합니다(SQL 인젝션 및 버퍼 오버플로 공격과 유사함).
이 웜은 다음의 두 가지 주요 기능을 수행합니다.
1. 데이터 유출: 감염된 시스템의 이메일에서 이름, 전화번호, 신용카드 정보, 주민등록번호 등 민감한 개인 데이터를 추출할 수 있습니다.
2. 스팸 전파: 침해된 AI 기반 이메일 어시스턴트를 통해 스팸 및 기타 악성 이메일을 생성하고 전송하여 다른 시스템을 감염시킬 수 있습니다.
연구원들은 통제된 환경에서 이러한 기능을 성공적으로 시연하여 웜이 생성형 AI 에코시스템에 침투하여 데이터를 훔치거나 멀웨어를 배포하는 방법을 보여주었습니다. 'Morris II' AI 웜은 현실 환경에서 발견된 적이 없으며, 연구원들은 공개적으로 사용 가능한 이메일 어시스턴트에서 테스트를 진행하지 않았습니다.
연구원들은 텍스트 프롬프트와 이미지 파일에 임베드된 프롬프트 모두에서 자가 복제 프롬프트를 사용할 수 있다는 사실을 발견했습니다.
텍스트 프롬프트 접근 방식을 시연하기 위해 연구원들은 적대적인 텍스트 프롬프트가 포함된 이메일을 작성했습니다. 이 프롬프트는 검색 증강 생성(RAG)을 사용하여 AI 이메일 어시스턴트의 데이터베이스를 '포이즈닝'하고, 이를 통해 LLM이 외부 데이터를 가져올 수 있도록 했습니다. RAG는 이메일을 받아 LLM 제공업체에 보냈습니다. 그리고 LLM 제공업체는 AI 서비스를 탈옥(jailbreak)하고, 이메일에서 데이터를 훔치고, 다른 고객의 이메일에 회신하는 데 LLM을 사용할 때 새 호스트를 감염시키는 응답을 생성했습니다.
이미지를 사용할 때 연구원들은 프롬프트를 이미지에 인코딩하여 이메일 어시스턴트가 메시지를 다른 이메일 주소로 전달하도록 했습니다. 이미지는 콘텐츠(스팸, 사기, 선전, 허위 정보 또는 악용 자료) 역할과 웜을 퍼뜨리는 활성화 페이로드 역할을 둘 다 수행합니다.
그러나 연구자들은 AI 시스템이 점점 더 발전하고 상호 연결됨에 따라 새로운 유형의 사이버 보안 위협이 등장했다고 말합니다. 연구실에서 만들어진 이 멀웨어는 LLM 기반 챗봇 서비스가 악의적인 사이버 공격에 악용될 수 있는 취약성을 드러낸 가장 최근의 사건입니다.
OpenAI는 취약점을 인정하고 시스템을 이러한 종류의 공격에 대한 저항력을 갖춘 시스템을 만들기 위해 노력 중이라고 밝혔습니다.
생성형 AI가 보편화됨에 따라 악의적인 행위자는 유사한 기술을 활용하여 데이터를 훔치거나, 허위 정보를 퍼뜨리거나, 시스템을 대규모로 중단시킬 수 있습니다. 또한 해외의 국가 단위 행위자가 선거에 개입하거나 사회적 분열을 조장하는 데 사용될 수도 있습니다.
우리는 AI 사이버 보안 도구(AI 위협 탐지 및 기타 사이버 보안 AI)가 사이버 공격으로부터 시스템과 데이터를 보호하는 데 있어 핵심적이고 필수적인 부분이 되었으며, 사이버 공격자가 이를 사용할 경우 위험을 초래하기도 하는 시대에 들어서고 있습니다.
이제 AI 사이버 보안 도구를 수용하고 사이버 공격에 사용될 수 있는 AI 도구를 확보해야 할 때입니다.