토큰화란 무엇인가요?

작성자

Jim Holdsworth

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

토큰화란 무엇인가요?

데이터 보안에서 토큰화는 민감한 데이터를 토큰이라고 하는 민감하지 않은 디지털 대체품으로 변환하여 원본으로 다시 매핑하는 프로세스입니다.

토큰화는 민감한 정보를 보호하는 데 도움이 될 수 있습니다. 예를 들어 민감한 데이터를 토큰에 매핑하고 디지털 보관소에 저장하여 안전하게 보관할 수 있습니다. 그러면 토큰이 데이터를 안전하게 대체하는 역할을 할 수 있습니다. 토큰 자체는 민감하지 않으며 데이터 저장소에 연결하지 않으면 사용도 또는 가치가 없습니다. 

귀사의 팀은 다음 제로데이를 제때 포착할 수 있을까요?

Think 뉴스레터를 통해 AI, 사이버 보안, 데이터 및 자동화에 대한 선별된 뉴스를 제공하는 보안 리더들과 함께하세요. 받은 편지함으로 직접 제공되는 전문가 튜토리얼과 설명서를 통해 빠르게 배울 수 있습니다. IBM 개인정보 보호정책을 참고하세요.

구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책 을 참조하세요.

https://www.ibm.com/kr-ko/privacy

토큰이란 무엇인가요?

디지털 토큰은 다른 자산이나 정보의 식별자 역할을 하는 문자의 모음입니다. 예를 들어, 기밀 보고서의 연간 비용 수치인 45,500,000달러를 "ot&14%Uyb"라는 토큰으로 대체할 수 있습니다.

토큰은 자연어 처리(NLP)에도 나타나지만 이 분야에서는 개념이 약간 다릅니다. NLP에서 토큰은 기계가 이해할 수 있는 개별 언어 단위(일반적으로 단어 또는 단어의 일부)입니다.

토큰화 유형에 따라 생성되는 다양한 토큰 유형은 일반적으로 다음과 같습니다.

  • 비가역 토큰은 바로 원래 값으로 다시 변환할 수 없는 토큰입니다. 데이터 익명화에 주로 사용되며, 이를 통해 토큰화된 데이터 세트를 제3자 분석에서 사용하거나 덜 안전한 환경에서 사용할 수 있습니다.

  • 가역 토큰은 탈토큰화를 거쳐 원래 데이터 값으로 다시 변환될 수 있습니다. 가역 토큰은 사람과 시스템이 원본 데이터에 액세스해야 할 때 유용합니다. 예를 들어, 환불을 처리할 때 결제 처리자는 결제 토큰을 실제 결제 카드 세부 정보로 다시 변환해야 할 수 있습니다.

  • 토큰은 대체하는 데이터와 동일한 형식을 가집니다. 예를 들어 1234-1234-1234-1234 형식의 신용 카드 번호 토큰은 8493-9756-1986-6455가 될 수 있습니다. 토큰 형식이 보존되면 토큰화 과정에서도 데이터 구조가 동일하게 유지되어 비즈니스가 연속성을 가질 수 있습니다. 이러한 안정적인 구조 덕분에 토큰은 기존 소프트웨어와 업데이트된 소프트웨어에 모두 호환될 가능성이 높습니다.

  • 토큰화를 사용하여 민감한 정보를 보호하는 결제 시스템에는 고가치 토큰과 저가치 토큰이 있습니다. 고가치 토큰(HVT)은 거래에서 기본 계좌 번호(PAN)를 대체할 수 있으므로 자체적으로 거래를 완료할 수 있습니다. 저가치 토큰(LVT)은 PAN을 대체할 수 있지만 거래를 완료할 수는 없습니다. LVT는 유효한 PAN에 매핑되어야 합니다.
원본 고객 기록과 토큰화된 버전을 보여주는 스크린샷.
고객 기록을 토큰화하는 방법의 예시

토큰화 작동 방식

토큰화 시스템에 주로 포함되는 구성 요소:

1. 여러 기술 중 하나를 통해 토큰을 생성하는 토큰 생성기입니다. 이러한 기술에는 다음과 같은 다양한 기능이 포함될 수 있습니다.

  • 연결된 암호화 키를 사용하여 되돌릴 수 있는 강력한 암호화 알고리즘을 사용하는 수학적으로 가역적인 암호화 함수입니다.

  • 해시 함수와 같은 단방향의 비가역적 암호화 함수입니다.

  • 무작위 토큰을 생성하는 난수 생성기로, 토큰 값을 생성하는 가장 강력한 기술 중 하나로 간주됩니다.

2. 원래 값에 새로 생성된 토큰 값을 할당하는 토큰 매핑 프로세스입니다. 토큰과 실제 데이터 간의 연결을 추적하기 위해 안전한 상호 참조 데이터베이스가 생성됩니다. 이 데이터베이스는 권한이 있는 사용자만 액세스할 수 있도록 안전한 데이터 저장소에 보관됩니다. 

3. 원래 값과 관련 토큰 값을 보유하는 토큰 데이터 저장소 또는 토큰 보관소입니다. 보관소에 저장된 데이터는 보안 강화를 위해 암호화되는 경우가 많습니다. 보관소는 토큰이 원래 값으로 다시 연결되는 유일한 위치입니다.

4. 보관소에 있는 데이터, 전송 중인 토큰 또는 토큰화 시스템의 다른 데이터와 자산을 암호화하는 데 사용된 모든 암호화 키를 추적하고 보호하는 암호화 키 관리자입니다.

토큰화는 보관소가 없을 때도 가능합니다. 민감한 정보를 안전한 데이터베이스에 저장하는 대신에, 보관소가 없는 토큰화는 암호화 알고리즘을 사용하여 민감한 데이터에서 토큰을 생성합니다. 동일한 알고리즘을 사용하여 프로세스를 역전하여 토큰을 원래 데이터로 되돌릴 수 있습니다. 대부분의 가역 토큰은 원래 민감한 정보를 보관소에 저장할 필요가 없습니다.

제3자 토큰화 공급자를 사용하면 원래의 민감한 데이터가 기업의 내부 시스템에서 제거되어 제3자의 스토리지로 옮겨지고 토큰으로 대체될 수 있습니다. 이는 기업 내에서 데이터 유출 위험을 완화하는 데 도움이 됩니다. 토큰 자체는 일반적으로 정상적인 운영을 간소화하기 위해 기업 내에 저장됩니다.

실제 토큰화 예시

  1. 정부 공식 웹사이트에 가입하려면 사회 보장 번호(SSN)를 입력해야 합니다.

  2. 웹사이트는 사회 보장 번호를 토큰화 서비스로 보냅니다. 토큰화 서비스는 SSN을 나타내는 토큰을 생성하고 실제 SSN을 안전한 보관소에 저장합니다.

  3. 토큰화 서비스는 토큰을 웹사이트로 다시 보냅니다. 웹사이트는 민감하지 않은 토큰만 저장합니다. 웹사이트는 민감하지 않은 토큰만 저장합니다.

  4. 웹사이트가 나중에 방문 시 사용자의 신원을 확인하기 위해 원래 SSN에 액세스해야 하는 경우(예: 나중에 방문 시 사용자의 신원을 확인하기 위해) 토큰을 토큰화 서비스로 다시 보냅니다. 서비스는 토큰을 보관소에 있는 올바른 SSN과 일치시켜 사용자의 신원을 확인합니다. 

토큰화의 사용 사례 및 이점

토큰화 방법은 많은 산업 및 비즈니스 기능 전반에 걸쳐 다양한 유형의 데이터에 대한 추가 데이터 보호를 제공할 수 있습니다.

데이터 보안

데이터를 토큰화하면 사내 데이터 시스템에서 민감한 데이터 요소의 일부 또는 전부를 제거하거나 위장할 수 있습니다. 이렇게 하면 해커가 훔쳐 갈 만한 귀중한 데이터가 줄어들거나 아예 없어져서 조직의 취약성을 줄이는 데 도움이 됩니다.

토큰화는 민감한 비즈니스 데이터와 여권 번호 또는 주민등록번호와 같은 개인 식별 정보(PII)를 보호하는 데 자주 사용됩니다. 금융 서비스, 마케팅 및 소매에서 토큰화는 종종 카드 소지자 데이터 및 계좌 정보를 보호하는 데 사용됩니다.

각 민감한 정보에는 고유한 식별자가 부여됩니다. 이러한 토큰은 대부분의 중간 데이터 사용(민감한 데이터를 수집한 후 최종 처리되기 전에 사용하는 경우)에 실제 데이터 대신 사용할 수 있으며, 토큰을 해독할 필요 없이 사용할 수 있습니다.

토큰화는 조직이 규정 준수 요건을 충족하는 데도 도움이 될 수 있습니다. 예를 들어, 많은 의료 기관에서 토큰화를 사용하여 건강 보험 양도 및 책임에 관한 법률(HIPAA)에서 부과하는 데이터 개인정보 보호 규정을 준수하고 있습니다.

일부 액세스 제어 시스템에서는 디지털 토큰을 사용하기도 합니다. 예를 들어 토큰 기반 인증 프로토콜에서 사용자는 자신의 신원을 확인하고 그 대가로 보호된 서비스 및 자산에 액세스하는 데 사용할 수 있는 액세스 토큰을 받습니다. 많은 애플리케이션 프로그래밍 인터페이스(API)가 이러한 방식으로 토큰을 사용합니다. 

디지털 결제

은행, 전자 상거래 웹사이트 및 기타 앱은 종종 토큰화를 사용하여 은행 계좌 번호, 신용카드 번호 및 기타 민감한 데이터를 보호합니다.

결제 처리 중에 토큰화 시스템은 신용카드 정보, 기본 계좌 번호(PAN) 또는 기타 금융 데이터를 토큰으로 대체할 수 있습니다.

이 토큰화 프로세스는 구매와 금융 정보 간의 연결을 제거하여 악의적인 행위자로부터 고객의 민감한 데이터를 보호합니다.

자연어 처리(NLP)

토큰화는 자연어 처리(NLP)에 사용되는 전처리 기술입니다. NLP 도구는 일반적으로 단어, 절, 문장 및 단락과 같은 언어 단위의 텍스트를 처리합니다. 따라서 NLP 알고리즘은 먼저 큰 텍스트를 NLP 도구가 처리할 수 있는 더 작은 토큰으로 분할해야 합니다. 토큰은 알고리즘이 이해할 수 있는 방식으로 텍스트를 나타냅니다.  

이 그림은 NLP 알고리즘이 텍스트를 토큰 컬렉션으로 분할하는 방법을 보여줍니다.
이 그림은 NLP 알고리즘이 텍스트를 토큰 컬렉션으로 분할하는 방법을 보여줍니다.

규정 준수 요구 사항

데이터 토큰화는 조직이 정부 규제 요구 사항 및 산업 표준을 준수하도록 지원할 수 있습니다. 많은 조직이 토큰화를 개인정보 보호를 위한 비파괴적 난독화의 한 형태로 사용합니다.

예를 들어, 결제 카드 산업 데이터 보안 표준(PCI DSS)은 기업이 카드 소유자 데이터를 보호하기 위해 사이버 보안 요건을 충족하도록 의무화하고 있습니다. 기본 계정 번호를 토큰화하는 것은 이러한 요건을 준수하기 위해 조직이 취할 수 있는 단계 중 하나입니다. 토큰화는 또한 조직이 EU의 일반 데이터 보호 규정(GDPR)에 명시된 데이터 개인 정보 보호 규칙을 준수하는 데 도움이 될 수 있습니다.

자산 토큰화

토큰은 유형 또는 무형의 자산을 나타내는 데 사용할 수 있습니다. 토큰화된 자산은 실제 자산보다 더 안전하고 쉽게 이동하거나 거래할 수 있어 조직이 거래를 자동화하고 운영을 간소화하며 자산 유동성을 높일 수 있습니다.

토큰으로 표시되는 유형 자산에는 예술품, 장비 또는 부동산이 포함될 수 있습니다. 무형 자산에는 채권이나 주식처럼 투자 수익을 약속하는 데이터, 지적 재산 또는 보안 토큰이 포함됩니다. 대체 불가능한 토큰(NFT)을 사용하면 예술품, 음악, 디지털 수집품과 같은 디지털 자산을 구매할 수 있습니다.

블록체인

토큰 기반 블록체인 기술은 거래 시간과 정산 사이에 지연이 발생할 수 있는 기존 방식과 달리 단 한 번의 거래로 소유권과 가치를 이전할 수 있게 해줍니다. 스마트 계약은 블록체인에서 토큰 전송 및 기타 거래를 자동화하는 데 도움이 될 수 있습니다.

암호화폐는 블록체인 토큰을 사용하여 자산이나 이자를 블록체인에 토큰화할 수 있습니다. 스테이블 코인이라고 하는 자산 지원 토큰은 중개자와 에스크로 계정을 제거하여 비즈니스 프로세스를 최적화할 수 있습니다. 

토큰화와 암호화 비교

토큰화는 민감한 데이터를 민감하지 않은(그리고 쓸모없는) 문자 문자열로 바꿉니다. 암호화는 암호 해독 키라고 하는 비밀 키로 해독할 수 있도록 데이터를 스크램블합니다.

토큰화와 암호화는 모두 데이터를 보호하는 데 도움이 될 수 있지만 사용 사례가 서로 다른 경우가 많습니다. 토큰화는 정기 결제를 위해 결제 데이터를 저장하는 등 원본 데이터를 쉽게 대체할 수 있는 상황에서 흔히 사용됩니다. 암호화는 저장 및 전송 중인 데이터를 보호하는 등 원본 데이터에 대한 액세스가 중요한 상황에서 흔히 사용됩니다.

토큰화는 암호화보다 리소스 집약적인 프로세스가 될 수 있습니다. 토큰화는 민감하지 않은 토큰으로 데이터를 교환하기만 하면 되지만, 암호화 시스템은 데이터를 사용할 때 정기적으로 암호화와 복호화를 수행해야 하므로 비용이 많이 들 수 있습니다. 

관련 솔루션
데이터 보안 및 보호 솔루션

다양한 환경에서 데이터를 보호하고 개인정보 보호 규정을 준수하며 운영상의 복잡성을 간소화합니다.

    데이터 보안 솔루션 살펴보기
    IBM Guardium

    온프레미스 및 클라우드의 민감한 데이터를 보호하는 데이터 보안 소프트웨어 제품군인 IBM Guardium에 대해 알아보세요.

     

      IBM Guardium 살펴보기
      데이터 보안 서비스

      IBM은 엔터프라이즈 데이터, 애플리케이션 및 AI를 보호하기 위한 포괄적인 데이터 보안 서비스를 제공합니다.

      데이터 보안 서비스 살펴보기
      다음 단계 안내

      데이터 보안 솔루션으로 하이브리드 클라우드 전체에서 조직의 데이터를 보호하고 규정 준수 요구 사항을 간소화하세요.

      데이터 보안 솔루션 살펴보기 라이브 데모 예약하기