최근 몇 년 동안 ChatGPT 및 기타 대규모 언어 모델(LLM)의 사용이 광범위하고 증가함에 따라 사이버 보안이 최고의 관심사가 되었습니다. 사이버 보안 전문가들은 여러 질문 중에서도 이러한 도구가 공격을 시작하는 데 얼마나 효과적인지 궁금해했습니다. 사이버 보안 연구원인 Richard Fang, Rohan Bindu, Akul Gupta, Daniel Kang은 이에 대한 답을 찾기 위한 연구를 최근 수행했습니다. 결론은 매우 효과적이었습니다.
연구 기간 동안 팀은 실생활에서 발생하는 15개의 원데이 취약점을 사용했습니다. 원데이 취약점이란 문제가 발견된 시점부터 패치가 생성된 시점 사이의 기간을 의미하며, 즉 이미 알려진 취약점이라는 뜻입니다. 사례에는 취약점이 존재하는 웹사이트, 컨테이너 관리 소프트웨어, Python 패키지가 포함되었습니다. 모든 취약점은 CVE 데이터베이스에서 가져왔기 때문에 CVE 설명이 함께 제공되었습니다.
LLM 에이전트에는 웹 브라우징 요소, 터미널, 검색 결과, 파일 생성 및 코드 인터프리터도 있었습니다. 또한 연구원들은 총 1,056개의 토큰과 91줄의 코드로 구성된 매우 상세한 프롬프트를 사용했습니다. 프롬프트에는 디버깅 및 로깅 명령문도 포함되어 있습니다. 그러나 프롬프트에는 하위 에이전트나 별도의 계획 모듈이 포함되지 않았습니다.
연구팀은 ChatGPT가 87%의 확률로 원데이 취약점을 정확하게 악용할 수 있다는 사실을 빠르게 확인했습니다. LLM 및 오픈 소스 취약점 스캐너를 포함하여 테스트된 다른 모든 방법은 어떤 취약점도 악용하지 못했습니다. GPT-3.5 역시 취약점 탐지에 실패했습니다. 보고서에 따르면 GPT-4는 단 두 개의 취약점을 탐지하는 데 실패했는데, 두 가지 모두 탐지하기 매우 까다로운 사례였습니다.
“Iris 웹 앱은 탐색이 JavaScript를 통해 탐색이 이루어지기 때문에 LLM 에이전트가 탐색하기 매우 어렵습니다. 그 결과 에이전트는 필요한 요소를 먼저 활성화하지 않은 상태에서 양식/버튼에 접근하려다 실패하게 됩니다. HertzBeat에 대한 상세 설명은 중국어로 되어 있어, 영어 프롬프트를 사용하는 GPT-4 에이전트가 혼란스러울 수 있습니다.”라고 보고서 작성자들은 설명했습니다.
연구진은 성공률이 높은 이유는 복잡한 다단계 취약점을 악용하고, 다양한 공격 방법을 실행하며, 익스플로잇 코드를 작성하고, 웹 이외의 취약점까지 조작할 수 있는 툴의 능력에 있다고 결론지었습니다.
또한, 이번 연구에서는 취약점을 발견하는 데 있어 ChatGPT의 중요한 한계점도 확인할 수 있었습니다. CVE 코드 없이 취약점을 악용하도록 요청하자, LLM은 동일한 수준의 성능을 발휘하지 못했습니다. CVE 코드가 없을 경우 GPT-4의 성공률은 7%에 불과했으며, 이는 80%나 감소한 수치입니다. 이 큰 격차를 확인한 후, 연구진은 관점을 달리하여 GPT-4가 올바른 취약점을 판별할 수 있는 빈도를 별도로 측정했으며, 그 결과는 33.3%였습니다.
“놀랍게도 CVE 설명이 있을 때와 없을 때 수행된 평균 작업 횟수의 차이는 14%(각각 24.3회 vs 21.3회)에 불과했습니다. 이는 컨텍스트 창 길이가 부분적으로 영향을 미친 것으로 추정되며, 계획 메커니즘과 서브 에이전트가 도입되면 성능이 더욱 향상될 가능성이 있음을 시사합니다.”라고 연구진은 밝혔습니다.
연구진은 이번 연구를 통해 LLM이 자율적으로 원데이 취약점을 악용할 능력이 있음을 보여주었으며, 현재 이 수준에 도달한 모델은 GPT-4뿐이라고 결론지었습니다. 그러나 우려되는 점은 LLM의 능력과 기능이 향후 더욱 발전함에 따라, 사이버 범죄자들에게 훨씬 더 파괴적이고 강력한 툴로 활용될 수 있다는 점입니다.
“우리의 결과는 새로운 능력의 출현 가능성을 보여주는 동시에, 취약점을 찾아내는 것이 이를 악용하는 것보다 훨씬 어렵다는 점을 의미합니다. 그럼에도 불구하고, 이번 연구 결과는 더 광범위한 사이버 보안 커뮤니티와 LLM 제공업체가 방어 체계에 LLM 에이전트를 어떻게 통합할지, 그리고 이 에이전트를 광범위하게 배포하는 것을 신중히 고민할 필요가 있음을 강조합니다.”라고 연구진은 결론지었습니다.
