CAPTCHA란 무엇인가요?

CAPTCHA는 '컴퓨터와 사람을 구분하는 완전히 자동화된 공개 튜링 테스트*'의 약자입니다. 사용자를 봇이 아닌 인간으로 검증하는 다양한 인증 방법을 의미하며, 인간에게는 간단하지만 기계에게는 어려운 문제를 제시합니다.

CAPTCHA 사기꾼과 스팸 발송자가 봇을 사용하여 악의적인 목적으로 웹 양식을 작성하는 것을 방지합니다.

기존 CAPTCHA의 경우 사용자가 광학 문자 인식(OCR) 기술로 해석할 수 없는 왜곡된 텍스트를 읽고 올바르게 다시 입력해야 했습니다. 최신 버전의 CAPTCHA 기술은 AI 기반 행동 및 위험 분석을 사용하여 단일 작업이 아닌 활동 패턴을 기반으로 인간 사용자를 인증합니다.

많은 웹사이트는 사용자가 계정 프로필에 로그인하거나, 등록 양식을 제출하거나, 댓글을 게시하거나, 해커가 봇을 사용하여 수행할 수 있는 기타 작업을 수행하기 전에 CAPTCHA 챌린지를 완료하도록 요구합니다. 챌린지를 완료함으로써 사용자는 자신이 인간임을 확인하고 웹사이트에서 활동을 계속할 수 있습니다.

* 튜링 테스트는 창시자 Alan Turing의 이름을 딴 것으로, 기계가 인간의 지능을 발휘하는 능력을 테스트합니다.

귀사의 팀은 다음 제로데이를 제때 포착할 수 있을까요?

Think 뉴스레터를 통해 AI, 사이버 보안, 데이터 및 자동화에 대한 선별된 뉴스를 제공하는 보안 리더들과 함께하세요. 받은 편지함으로 직접 제공되는 전문가 튜토리얼과 설명서를 통해 빠르게 배울 수 있습니다. IBM 개인정보 보호정책을 참고하세요.

CAPTCHA의 진화

여러 그룹이 1990년대 후반과 2000년대 초반에 초기 형태의 CAPTCHA 기술을 동시에 개발했습니다. 각 그룹은 인터넷에서 불법적인 활동을 위해 봇을 사용하는 해커들의 광범위한 문제를 해결하기 위해 노력했습니다. 예를 들어, 검색 엔진 AltaVista에서 일하는 컴퓨터 과학자들은 봇이 회사의 링크 데이터베이스에 악성 웹 주소를 추가하는 것을 막고자 했습니다.

IT 회사인 Sanctum의 연구원들은 1997년에 최초의 CAPTCHA 스타일 시스템을 제출했습니다. 그러나 Luis von Ahn과 Manuel Blum이 이끄는 Carnegie Mellon University의 컴퓨터 과학 연구원 그룹이 2003년에 CAPTCHA라는 용어를 처음 도입했습니다. 이 팀은 수백만 개의 가짜 이메일 계정에 가입하는 스팸봇과 관련된 회사의 문제에 대해 이야기한 Yahoo 임원으로부터 이 기술에 대한 영감을 받았습니다.

Yahoo의 문제를 해결하기 위해 von Ahn과 Blum은 다음을 수행하는 컴퓨터 프로그램을 만들었습니다.

임의의 텍스트 문자열을 생성합니다.
해당 텍스트의 왜곡된 이미지('CAPTCHA 코드'라고 함)를 생성합니다.
사용자에게 이미지를 표시합니다.
사용자에게 양식 필드에 텍스트를 입력한 다음 '로봇이 아닙니다.'라는 문구 옆의 확인란을 클릭하여 항목을 제출하도록 요청합니다.

당시의 OCR 기술은 이렇게 왜곡된 텍스트를 해독하는 데 어려움을 겪었기 때문에 봇은 CAPTCHA 챌린지를 통과할 수 없었습니다. 사용자가 올바른 문자열을 입력하면 사용자가 사람이라고 확실하게 가정할 수 있으며 계정 등록 또는 웹 양식 제출을 완료할 수 있습니다.

Yahoo는 Carnegie Mellon의 기술을 구현하여 모든 사용자가 이메일 주소를 등록하기 전에 CAPTCHA 테스트를 통과하도록 요구했습니다. 이를 통해 스팸봇 활동이 크게 줄어들었고 다른 기업들도 웹 양식을 보호하기 위해 보안 문자를 채택하기 시작했습니다. 그러나 시간이 지남에 따라 해커는 완료된 CAPTCHA 챌린지의 데이터를 사용하여 CAPTCHA 테스트를 안정적으로 통과할 수 있는 알고리즘을 개발했습니다. 이는 CAPTCHA 개발자와 사이버 범죄자 간의 지속적인 경쟁의 시작을 의미했고, 이는 CAPTCHA 기능의 발전을 촉진했습니다.

reCAPTCHA v1

von Ahn이 2007년에 출시한 reCAPTCHA v1은 두 가지 목표를 가지고 있었습니다. 바로 텍스트 기반 CAPTCHA 챌린지를 봇이 해독하기 어렵게 만들고, 당시 인쇄된 텍스트를 디지털화하는 데 사용하던 OCR의 정확도를 개선하는 것이었습니다.

reCAPTCHA는 사용자에게 표시되는 텍스트의 왜곡을 증가시키고 결국 텍스트에 선을 추가함으로써 첫 번째 목표를 달성했습니다.

또한 무작위로 생성된 왜곡된 텍스트의 단일 이미지를 두 개의 다른 OCR 프로그램으로 실제 텍스트에서 스캔한 단어의 왜곡된 텍스트 이미지 두 개로 대체하여 두 번째 목표를 달성했습니다. 첫 번째 단어 또는 제어 단어는 두 OCR 프로그램 모두에서 올바르게 식별된 단어였습니다. 두 번째 단어는 두 OCR 프로그램이 모두 식별하지 못한 단어였습니다. 사용자가 제어 단어를 올바르게 식별한 경우 reCAPTCHA는 사용자가 사람이라고 가정하고 작업을 계속할 수 있도록 허용했으며, 사용자가 두 번째 단어를 올바르게 식별한 것으로 가정하고 향후 OCR 결과를 확인하는 데 응답을 사용했습니다.

이러한 방식으로 reCAPTCHA는 봇 방지 보안을 개선하고 Internet Archive와 New York Times에서 디지털화되는 텍스트의 정확성을 개선했습니다. 아이러니하게도 시간이 지나면서 2014년에는 가장 왜곡된 텍스트 CAPTCHA 99.8% 식별할 수 있을 정도로 인공 지능과 머신 러닝 알고리즘을 개선하는 데도 도움이 되었습니다.

2009년 Google은 reCAPTCHA를 인수하여 Google Books의 텍스트를 디지털화하는 데 사용하기 시작했으며 다른 조직에 서비스로 제공했습니다. 그러나 reCAPTCHA의 도움으로 OCR 기술이 발전함에 따라 텍스트 기반 reCAPTCHA를 효과적으로 해결할 수 있는 인공 지능 프로그램도 발전했습니다. 이에 대응하여 Google은 2012년에 이미지 인식 reCAPTCHA를 도입하여 왜곡된 텍스트를 Google 스트리트 뷰에서 가져온 이미지로 대체했습니다. 사용자는 가로등이나 택시와 같은 실제 물체를 식별하여 인간성을 입증했습니다. 이러한 이미지 기반 reCAPTCHA는 현재 봇이 배포하는 고급 OCR을 우회할 뿐만 아니라 모바일 앱 사용자에게 더 편리한 것으로 간주되었습니다.

Google reCAPTCHA v2: No CAPTCHA reCAPTCHA

2014년 Google은 텍스트 및 이미지 기반 챌린지를 '로봇이 아닙니다.'라는 간단한 확인란으로 대체한 reCAPTCHA v2를 출시했습니다. 사용자가 확인란을 선택하면 reCAPTCHA v2는 사용자와 웹페이지의 상호 작용을 분석하여 입력 속도, 쿠키, 디바이스 기록, IP 주소와 같은 요소를 평가하여 사용자가 사람일 가능성이 높은지 여부를 판단합니다. 이 확인란은 CAPTCHA 작동 방식의 일부이기도 합니다. no CAPTCHA reCAPTCHA는 사용자가 확인란을 클릭할 때 마우스의 움직임을 추적합니다. 사람의 움직임은 더 혼란스러운 경향이 있는 반면, 봇의 움직임은 더 정밀합니다. no CAPTCHA reCAPTCHA는 사용자가 봇일 가능성이 있다고 의심될 경우 이미지 기반 CAPTCHA 챌린지를 표시합니다.

reCAPTCHA v3

2018년에 출시된 reCAPTCHA v3는 확인란을 없애고 no CAPTCHA reCAPTCHA의 AI 기반 위험 분석을 확장했습니다. ReCAPTCHA v3는 JavaScript API를 통해 웹페이지와 통합되고 백그라운드에서 실행되며, 사용자의 행동을 0.0(봇일 가능성)부터 1.0(인간일 가능성)까지의 척도로 채점합니다. 웹사이트 소유자는 사용자의 점수가 봇일 수 있음을 시사하는 특정 순간에 트리거되도록 자동화된 작업을 설정할 수 있습니다. 예를 들어, 점수가 낮은 사용자의 블로그 댓글은 '제출'을 클릭하면 검토 대기열로 보내지거나 점수가 낮은 사용자가 계정에 로그인을 시도할 때 다단계 인증 프로세스를 완료하라는 메시지가 표시될 수 있습니다.

reCAPTCHA v3와 같은 AI 기반 인증 방법은 해커의 문제를 피하고자 합니다. CAPTCHA 인증 프로세스에서 대화형 챌린지를 제거함으로써 해커가 이전에 해결한 챌린지의 데이터를 사용하여 새로운 CAPTCHA를 해독하도록 봇을 학습시키는 것을 방지합니다. 이 때문에 전문가들은 AI 기반 CAPTCHA가 향후 5~10년 내에 챌린지 기반 CAPTCHA를 완전히 대체하는 표준이 될 것이라고 믿고 있습니다.

CAPTCHA 사용 사례

CAPTCHA 기술은 봇 탐지 및 방지 수단으로 다음과 같은 몇 가지 일반적인 용도로 사용됩니다.

허위 등록 방지
의심스러운 거래로부터 보호
온라인 투표 무결성 보호
댓글 및 제품 리뷰 스팸 방지
무차별 대입 및 사전 공격에 대한 방어

허위 등록 방지

이메일 계정, 소셜 미디어 프로필 또는 기타 온라인 서비스에 가입하기 전에 사용자에게 CAPTCHA 테스트를 제공함으로써 회사는 이러한 서비스를 사용하여 스팸 또는 맬웨어를 퍼뜨리거나 악의적인 활동을 수행하는 봇을 차단할 수 있습니다. CAPTCHA의 얼리 어답터는 Yahoo, Microsoft 및 AOL과 같은 회사로, 봇이 가짜 이메일 계정에 등록하는 것을 막고자 했습니다.

의심스러운 거래로부터 보호

Ticketmaster와 같은 회사는 CAPTCHA를 사용하여 봇이 콘서트 티켓과 같은 제한된 상품을 구매하여 2차 시장에서 재판매하는 것을 방지했습니다.

온라인 투표 무결성 보호

봇은 CAPTCHA와 같은 억제 수단이 없으면 온라인 투표에 개입할 수 있습니다. 온라인 투표 결과의 무결성을 보호해야 할 필요성 때문에 CAPTCHA와 같은 기술에 대한 초기 실험이 이루어졌습니다. 예를 들어, 1996년 미국 대통령 선거 기간 동안 온라인 여론조사의 품질을 보장하기 위해 Digital Equipment Corporation은 사용자에게 투표를 하기 전에 웹 페이지에서 픽셀화된 국기 이미지를 찾아 클릭하도록 요청했습니다.

댓글 및 제품 리뷰 스팸 방지

사기꾼과 사이버 범죄자들은 종종 블로그와 기사 댓글 섹션을 이용해 사기와 맬웨어를 퍼뜨리기도 합니다. 또한 이커머스 웹사이트나 검색 엔진에서 제품의 순위를 인위적으로 높이기 위해 가짜 리뷰를 대량으로 게시하는 리뷰 스팸에 가담할 수도 있습니다. 봇은 보호되지 않은 댓글 섹션을 이용해 사용자를 괴롭히는 캠페인을 시행할 수도 있습니다. 댓글이나 리뷰를 게시하기 전에 사용자에게 CAPTCHA를 작성하도록 요청하여 이러한 악의적인 활동을 완화할 수 있습니다.

무차별 대입 및 사전 공격에 대한 방어

무차별 대입 공격에서 해커는 올바른 암호를 찾을 때까지 봇을 사용하여 숫자, 문자 및 특수 문자의 조합을 추측하여 계정에 침입합니다. 이러한 공격은 사용자가 특정 횟수의 로그인 시도에 실패하면 CAPTCHA를 완료하도록 요구하여 중단할 수 있습니다.

CAPTCHA의 단점

CAPTCHA 기술은 일반적으로 봇을 차단하는 데 효과적인 것으로 입증되었지만 다음과 같은 단점도 있습니다.

불편한 사용자 경험
접근성 문제
전환율 감소
새로운 CAPTCHA를 무력화할 수 있는 Bot AI의 능력
개인정보 보호 문제

불편한 사용자 경험

CAPTCHA 챌린지는 회원 가입, 로그인, 양식 작성 과정에 한 단계를 추가하기 때문에 이를 번거로워 하는 사람들도 있습니다. 또한 점점 정교해지는 봇을 무력화하기 위해 CAPTCHA도 복잡해지다 보니 사용자들은 불편을 느낍니다. 2010년 연구에서 스탠포드 대학 연구원이 3명으로 구성된 그룹에게 동일한 CAPTCHA를 풀도록 요청했을 때 CAPTCHA 솔루션에 만장일치로 동의하는 참가자는 71%에 불과했습니다. 또한 영어가 모국어가 아닌 사람들이 영어 원어민보다 CAPTCHA 풀이를 더 어려워 한다는 사실이 나타났으며, 이는 일부 인구 집단이 다른 집단에 비해 CAPTCHA를 어려워할 수 있음을 시사합니다.

접근성 문제

텍스트 및 이미지 CAPTCHA는 시각 장애가 있는 사용자가 해결하기가 매우 어렵거나 불가능할 수 있습니다. 이는 스크린 리더가 대부분의 CAPTCHA 챌린지를 읽을 수 없다는 사실로 인해 더욱 복잡해졌는데, 이러한 테스트는 기계가 읽을 수 없도록 설계되었기 때문입니다.

이 문제를 해결하기 위해 대체 형식의 CAPTCHA가 시도되었지만 자체적으로 한계가 있었습니다. 사용자가 왜곡된 오디오를 해독해야 하는 오디오 CAPTCHA는 해결하기가 매우 어렵기로 악명이 높습니다. 앞서 언급한 스탠포드 대학의 연구에 따르면 사용자가 오디오 CAPTCHA 솔루션에 만장일치로 동의하는 비율은 31%에 불과했습니다.

사용자가 간단한 수학 문제를 풀어야 하는 CAPTCHA의 일종인 MAPTCHA는 알고리즘에 의해 해독될 가능성이 매우 높습니다.

액세스할 수 없는 CAPTCHA를 사용하면 법적 처벌을 받을 수도 있습니다. 1998년에 도입된 1973년 재활법 개정안 508조에 따라 미국 연방 기관과 민간 부문 파트너는 장애인이 디지털 정보에 액세스할 수 있도록 해야 합니다. 회사는 액세스할 수 있는 CAPTCHA 옵션이 없는 경우 이 요구 사항을 위반할 수 있습니다.

전환율 감소

CAPTCHA의 불편한 사용자 경험과 접근성은 전환율에 부정적인 영향을 미칠 수 있습니다. 50개 웹사이트를 대상으로 한 2009년 사례 연구에 따르면, 사용자에게 CAPTCHA를 완료하도록 요청한 결과 합법적인 전환율이 3.2% 감소했습니다. 오디오 CAPTCHA는 특히 문제가 큽니다. 앞서 언급한 스탠포드 연구에 따르면 사용자들 중 사운드 기반 CAPTCHA 문제를 풀다가 포기하는 비율은 50%에 달합니다.

새로운 CAPTCHA를 무력화할 수 있는 Bot AI의 능력

봇이 각각의 새로운 CAPTCHA 챌린지를 물리치기 위해 지속적으로 진화했기 때문에 CAPTCHA 체계는 기술이 시작된 이래로 여러 번 변경되었습니다. 이 문제는 CAPTCHA 기술의 구조 자체에서 비롯되는데, CAPTCHA는 봇을 방해하기 위해 해결되지 않은 AI 문제에 의존하기 때문입니다. 인간이 CAPTCHA 문제를 해결하면 이는 이전에는 불가능했던 이러한 AI 문제를 극복하기 위해 머신 러닝 알고리즘을 훈련할 수 있는 데이터 세트를 생성합니다. 예를 들어, 2016년 컴퓨터 과학 연구원인 Jason Polakis는 Google의 역 이미지 검색을 사용하여 Google의 이미지 기반 CAPTCHA를 70% 해결했습니다.

개인정보 보호 문제

새로운 형태의 CAPTCHA는 대화형 챌린지를 완전히 제거하여 접근성 문제를 해결하고 봇 경쟁을 중단하려고 시도하지만, 일부 사용자와 연구원은 AI 기반 CAPTCHA가 침습적이라고 생각합니다. 사람들은 reCAPTCHA v3가 코드와 쿠키를 사용하여 여러 웹사이트에서 사용자를 추적하는 방법에 대해 우려를 제기했습니다. 일부 사람들은 이 추적 데이터가 검증 이외의 목적으로 어떻게 사용될 수 있는지에 대한 투명성이 충분하지 않다고 생각합니다.

IAM 실무자 가이드

IBM의 새로운 IAM 가이드가 ID 확산을 정리하고, 수작업을 자동화하며, 사람과 비인간 ID를 모두 대규모로 보호하는 방법을 알아보세요.

리소스

IDC MarketScape: 전 세계 ID 보안 벤더 평가

통합 ID 플랫폼이 더 스마트한 가시성, 적응형 거버넌스 및 AI 기반 위협 탐지를 통해 하이브리드 환경 전반에서 액세스를 간소화하는 방법을 알아보세요.

KuppingerCole Leadership Compass - 기업을 위한 비밀번호 없는 인증

비밀번호 없는 인증이 기업 보안을 어떻게 변화시키고 있는지 알아보세요. 조직이 올바른 접근 방식을 선택하는 데 도움이 되는 주요 시장 인사이트, 선도적인 솔루션 및 실용적인 지침을 소개합니다.

IBM, Gartner® Magic Quadrant™에서 액세스 관리 부문 리더로 선정

3년 연속 리더로 선정된 IBM이 보안 인증, 싱글사인온(SSO)과 적응형 액세스를 통해 액세스 관리 분야를 선도하는 방법을 알아보세요.

비인간 ID 관리용 KuppingerCole Leadership Compass

AI 에이전트와 서비스는 팀이 관리할 수 있는 것보다 빠르게 ID를 생성하고 있습니다. KuppingerCole이 HashiCorp®를 비인간 ID 관리 분야의 종합적인 리더로 선정한 이유와 제로 트러스트, 동적 자격 증명, 정책 기반 액세스 제어를 통해 모든 ID를 통제하는 방법을 알아보세요.

Identity Orchestration으로 IAM 사일로 전반에 걸쳐 ID 패브릭을 제작하세요.

Identity Orchestration은 툴을 연결하고 일관된 보안을 적용하며 온보딩부터 오프보딩까지 프로세스를 자동화하여 원활한 사용자 경험, 강력한 보안 및 공급업체의 유연성을 제공합니다.

데이터 유출 비용(CODB) 보고서

데이터 유출로 인한 비용이 최고치를 기록했습니다. 사이버 보안 위협과 조직에 미치는 재정적 영향에 대한 최신 인사이트를 확보하세요.