업계 뉴스레터
전문가의 인사이트를 바탕으로 한 최신 기술 뉴스
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
데이터 보안에서 토큰화는 민감한 데이터를 토큰이라고 하는 민감하지 않은 디지털 대체품으로 변환하여 원본으로 다시 매핑하는 프로세스입니다.
토큰화는 민감한 정보를 보호하는 데 도움이 될 수 있습니다. 예를 들어 민감한 데이터를 토큰에 매핑하고 디지털 보관소에 저장하여 안전하게 보관할 수 있습니다. 그러면 토큰이 데이터를 안전하게 대체하는 역할을 할 수 있습니다. 토큰 자체는 민감하지 않으며 데이터 저장소에 연결하지 않으면 사용도 또는 가치가 없습니다.
업계 뉴스레터
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
디지털 토큰은 다른 자산이나 정보의 식별자 역할을 하는 문자의 모음입니다. 예를 들어, 기밀 보고서의 연간 비용 수치인 45,500,000달러를 "ot&14%Uyb"라는 토큰으로 대체할 수 있습니다.
토큰은 자연어 처리(NLP)에도 나타나지만 이 분야에서는 개념이 약간 다릅니다. NLP에서 토큰은 기계가 이해할 수 있는 개별 언어 단위(일반적으로 단어 또는 단어의 일부)입니다.
토큰화 유형에 따라 생성되는 다양한 토큰 유형은 일반적으로 다음과 같습니다.
토큰화 시스템에 주로 포함되는 구성 요소:
1. 여러 기술 중 하나를 통해 토큰을 생성하는 토큰 생성기입니다. 이러한 기술에는 다음과 같은 다양한 기능이 포함될 수 있습니다.
2. 원래 값에 새로 생성된 토큰 값을 할당하는 토큰 매핑 프로세스입니다. 토큰과 실제 데이터 간의 연결을 추적하기 위해 안전한 상호 참조 데이터베이스가 생성됩니다. 이 데이터베이스는 권한이 있는 사용자만 액세스할 수 있도록 안전한 데이터 저장소에 보관됩니다.
3. 원래 값과 관련 토큰 값을 보유하는 토큰 데이터 저장소 또는 토큰 보관소입니다. 보관소에 저장된 데이터는 보안 강화를 위해 암호화되는 경우가 많습니다. 보관소는 토큰이 원래 값으로 다시 연결되는 유일한 위치입니다.
4. 보관소에 있는 데이터, 전송 중인 토큰 또는 토큰화 시스템의 다른 데이터와 자산을 암호화하는 데 사용된 모든 암호화 키를 추적하고 보호하는 암호화 키 관리자입니다.
토큰화는 보관소가 없을 때도 가능합니다. 민감한 정보를 안전한 데이터베이스에 저장하는 대신에, 보관소가 없는 토큰화는 암호화 알고리즘을 사용하여 민감한 데이터에서 토큰을 생성합니다. 동일한 알고리즘을 사용하여 프로세스를 역전하여 토큰을 원래 데이터로 되돌릴 수 있습니다. 대부분의 가역 토큰은 원래 민감한 정보를 보관소에 저장할 필요가 없습니다.
제3자 토큰화 공급자를 사용하면 원래의 민감한 데이터가 기업의 내부 시스템에서 제거되어 제3자의 스토리지로 옮겨지고 토큰으로 대체될 수 있습니다. 이는 기업 내에서 데이터 유출 위험을 완화하는 데 도움이 됩니다. 토큰 자체는 일반적으로 정상적인 운영을 간소화하기 위해 기업 내에 저장됩니다.
토큰화 방법은 많은 산업 및 비즈니스 기능 전반에 걸쳐 다양한 유형의 데이터에 대한 추가 데이터 보호를 제공할 수 있습니다.
데이터를 토큰화하면 사내 데이터 시스템에서 민감한 데이터 요소의 일부 또는 전부를 제거하거나 위장할 수 있습니다. 이렇게 하면 해커가 훔쳐 갈 만한 귀중한 데이터가 줄어들거나 아예 없어져서 조직의 취약성을 줄이는 데 도움이 됩니다.
토큰화는 민감한 비즈니스 데이터와 여권 번호 또는 주민등록번호와 같은 개인 식별 정보(PII)를 보호하는 데 자주 사용됩니다. 금융 서비스, 마케팅 및 소매에서 토큰화는 종종 카드 소지자 데이터 및 계좌 정보를 보호하는 데 사용됩니다.
각 민감한 정보에는 고유한 식별자가 부여됩니다. 이러한 토큰은 대부분의 중간 데이터 사용(민감한 데이터를 수집한 후 최종 처리되기 전에 사용하는 경우)에 실제 데이터 대신 사용할 수 있으며, 토큰을 해독할 필요 없이 사용할 수 있습니다.
토큰화는 조직이 규정 준수 요건을 충족하는 데도 도움이 될 수 있습니다. 예를 들어, 많은 의료 기관에서 토큰화를 사용하여 건강 보험 양도 및 책임에 관한 법률(HIPAA)에서 부과하는 데이터 개인정보 보호 규정을 준수하고 있습니다.
일부 액세스 제어 시스템에서는 디지털 토큰을 사용하기도 합니다. 예를 들어 토큰 기반 인증 프로토콜에서 사용자는 자신의 신원을 확인하고 그 대가로 보호된 서비스 및 자산에 액세스하는 데 사용할 수 있는 액세스 토큰을 받습니다. 많은 애플리케이션 프로그래밍 인터페이스(API)가 이러한 방식으로 토큰을 사용합니다.
은행, 전자 상거래 웹사이트 및 기타 앱은 종종 토큰화를 사용하여 은행 계좌 번호, 신용카드 번호 및 기타 민감한 데이터를 보호합니다.
결제 처리 중에 토큰화 시스템은 신용카드 정보, 기본 계좌 번호(PAN) 또는 기타 금융 데이터를 토큰으로 대체할 수 있습니다.
이 토큰화 프로세스는 구매와 금융 정보 간의 연결을 제거하여 악의적인 행위자로부터 고객의 민감한 데이터를 보호합니다.
토큰화는 자연어 처리(NLP)에 사용되는 전처리 기술입니다. NLP 도구는 일반적으로 단어, 절, 문장 및 단락과 같은 언어 단위의 텍스트를 처리합니다. 따라서 NLP 알고리즘은 먼저 큰 텍스트를 NLP 도구가 처리할 수 있는 더 작은 토큰으로 분할해야 합니다. 토큰은 알고리즘이 이해할 수 있는 방식으로 텍스트를 나타냅니다.
데이터 토큰화는 조직이 정부 규제 요구 사항 및 산업 표준을 준수하도록 지원할 수 있습니다. 많은 조직이 토큰화를 개인정보 보호를 위한 비파괴적 난독화의 한 형태로 사용합니다.
예를 들어, 결제 카드 산업 데이터 보안 표준(PCI DSS)은 기업이 카드 소유자 데이터를 보호하기 위해 사이버 보안 요건을 충족하도록 의무화하고 있습니다. 기본 계정 번호를 토큰화하는 것은 이러한 요건을 준수하기 위해 조직이 취할 수 있는 단계 중 하나입니다. 토큰화는 또한 조직이 EU의 일반 데이터 보호 규정(GDPR)에 명시된 데이터 개인 정보 보호 규칙을 준수하는 데 도움이 될 수 있습니다.
토큰은 유형 또는 무형의 자산을 나타내는 데 사용할 수 있습니다. 토큰화된 자산은 실제 자산보다 더 안전하고 쉽게 이동하거나 거래할 수 있어 조직이 거래를 자동화하고 운영을 간소화하며 자산 유동성을 높일 수 있습니다.
토큰으로 표시되는 유형 자산에는 예술품, 장비 또는 부동산이 포함될 수 있습니다. 무형 자산에는 채권이나 주식처럼 투자 수익을 약속하는 데이터, 지적 재산 또는 보안 토큰이 포함됩니다. 대체 불가능한 토큰(NFT)을 사용하면 예술품, 음악, 디지털 수집품과 같은 디지털 자산을 구매할 수 있습니다.
토큰화는 민감한 데이터를 민감하지 않은(그리고 쓸모없는) 문자 문자열로 바꿉니다. 암호화는 암호 해독 키라고 하는 비밀 키로 해독할 수 있도록 데이터를 스크램블합니다.
토큰화와 암호화는 모두 데이터를 보호하는 데 도움이 될 수 있지만 사용 사례가 서로 다른 경우가 많습니다. 토큰화는 정기 결제를 위해 결제 데이터를 저장하는 등 원본 데이터를 쉽게 대체할 수 있는 상황에서 흔히 사용됩니다. 암호화는 저장 및 전송 중인 데이터를 보호하는 등 원본 데이터에 대한 액세스가 중요한 상황에서 흔히 사용됩니다.
토큰화는 암호화보다 리소스 집약적인 프로세스가 될 수 있습니다. 토큰화는 민감하지 않은 토큰으로 데이터를 교환하기만 하면 되지만, 암호화 시스템은 데이터를 사용할 때 정기적으로 암호화와 복호화를 수행해야 하므로 비용이 많이 들 수 있습니다.