トークン化とは?

共同執筆者

Jim Holdsworth

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

トークン化とは

データ・セキュリティー において、トークン化とは、機密データを、元のデータにマッピングされる、機密性のないデジタル・データ( トークン )に変換するプロセスです。

トークン化は機密情報の保護に役立ちます。例えば、機密データをトークンにマッピングし、デジタル・ボールトに保管して安全に保管できます。トークンはデータの安全な代替として機能します。トークン自体は機密情報ではなく、データ・ボールトに接続しないと役に立たず、価値がありません。

あなたのチームは時間内に次のゼロデイを受け入れますか?

AI、サイバーセキュリティ、データ、自動化に関する厳選されたニュースをThinkニュースレターで購読しているセキュリティリーダーに加わりましょう。専門家によるチュートリアルと解説をメールで直接配信することで、手軽に学ぶことができます。IBMプライバシー・ステートメントをご覧ください。

サブスクリプションは英語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

https://www.ibm.com/jp-ja/privacy

トークンとは

デジタル・トークンは、他の資産や情報の識別子として機能する文字の集合です。例えば、機密レポート内の年間経費の数字45,500,000米ドルをトークン「ot&14%Uyb」に置き換えることができます。

トークンは自然言語処理(NLP)でも登場しますが、この分野では概念が若干異なります。NLPでは、トークンとは機械が理解できる個々の言語単位(通常は単語または単語の一部)のことです。

トークン化の種類によって、生成されるトークンの種類も異なります。一般的なトークンには次のものがあります。

  • 不可逆トークンとは、まさに元の価値に変換できないトークンのことです。不可逆トークンは、データを匿名化するためによく使用され、トークン化されたデータセットをサードパーティの分析や安全性の低い環境で使用できるようになります。

  • 可逆トークンは、デトークン化を行って元のデータ値に戻すことができます。可逆トークンは、人やシステムが元のデータにアクセスする必要がある場合に有効です。例えば、返金を発行する場合、支払い処理者は支払いトークンを実際の支払いカードの詳細に変換し直す必要がある場合があります。

  • フォーマット保持トークンは、置き換えられるデータと同じ形式を持ちます。例えば、1234-1234-1234-1234という形式のクレジットカード番号のトークンは、8493-9756-1986-6455などです。フォーマットを保持するトークンは、トークン化されても、データの構造が同じ状態を維持できるため、事業継続性がサポートされます。この安定した構造により、トークンは従来のソフトウェアとアップデートされたソフトウェアの両方と互換性がある可能性が高くなります。

  • トークン化を使用して機密情報を保護する支払いシステムには、高価値と低価値のトークンが含まれています。高価値トークン(HVT)は、トランザクションのプライマリー・アカウント番号(PAN)を置き換えることができ、それによってトランザクションを単独で完了することができます。低価値トークン(LVT)は PAN の代わりになりますが、トランザクションを完了することはできません。LVTは有効な PAN にマッピングする必要があります。
元の顧客レコードとトークン化されたバージョンを示すスクリーンショット。
顧客レコードをトークン化する一例

トークン化の仕組み

トークン化システムには、多くの場合、次のコンポーネントが含まれます。

1.複数の手法のいずれかを使用してトークンを作成するトークン・ジェネレーター。これらの手法には、さまざまな機能を含めることができます。

  • 関連する暗号化キーを使用して元に戻すことができる強力な暗号化アルゴリズムを使用する、数学的に可逆な暗号化関数。

  • ハッシュ関数などの一方向の非可逆暗号関数。

  • ランダムなトークンを作成するための乱数ジェネレーターであり、トークン値を生成するための最も強力な手法の1つと一般的に考えられています。

2. 新しく作成されたトークンの値を元の値に割り当てるトークン・マッピング・プロセス。トークンと実際のデータ間の関連を追跡するために、安全な相互参照データベースが作成されます。このデータベースは安全なデータ・ストアに保存され、許可されたユーザーのみがアクセスできます。

3. 元の値とそれに関連するトークン値を保持する トークンデータストア または トークン・ボールト 。多くの場合、ボールトに保管されるデータは、セキュリティーを強化するために暗号化されます。ボールトは、トークンがもともとの価値に戻される唯一の場所です。

4. ボールト内のデータ、転送中のトークン、トークン化システム内のその他のデータや資産を暗号化するために使用される暗号鍵を追跡し、保護するための 暗号化 鍵マネージャー です。

ボールトなしのトークン化も可能です。ボールトなしのトークン化では、機密情報を安全なデータベースに保管するのではなく、暗号化アルゴリズムを使用して機密データからトークンを生成します。同じアルゴリズムを使用してプロセスを逆転させ、トークンを元のデータに戻すことができます。ほとんどの可逆トークンでは、元の機密情報をボールトに保管する必要はありません。

サードパーティのトークン化プロバイダーが使用されると、元の機密データが企業の内部システムから削除され、サードパーティのストレージに動きトークンに置き換えられる可能性があります。この置き換えは、企業内のデータ侵害のリスクを軽減するのに役立ちます。トークン自体は通常、通常のオペレーションを合理化するために企業内に保管されます。

トークン化の実行例

  1. 米政府の公式Webサイトでアカウントを作成する場合、ユーザーは米国社会保障番号(SSN)を入力する必要があります。

  2. Webサイトは、社会保障番号をトークン化サービスに送信します。トークン化サービスは、SSNを表すトークンを生成し、実際のSSNをボールトに保管します。

  3. トークン化サービスは、トークンをWebサイトに送り返します。Webサイトには、機密性の低いトークンのみが保管されています。

  4. Webサイトが元のSSNにアクセスする必要がある場合(例えば、後で訪問したときにユーザーの身元を確認する場合)、トークンをトークン化サービスに送り返します。サービスはトークンをその保管庫内の正しいSSNと照合して、ユーザーの身元を確認します。

トークン化のユースケースとメリット

トークン化方式により、さまざまな業界や業務機能にわたるさまざまな種類のデータに、追加の データ保護がもたらされます。

データ・セキュリティー

データのトークン化により、組織は社内データ・システムから一部またはすべての機密データ要素を削除または偽装することが可能になります。その結果、ハッカーが盗む価値のあるデータが減るか、まったくなくなるため、組織のデータ侵害に対する脆弱性が軽減されます。

トークン化は、パスポート番号や社会保障番号などの機密ビジネスデータや個人情報(PII)を保護するためによく使用されます。金融サービス、マーケティング、小売業界では、カード会員データと口座情報を保護するために、トークン化がよく使用されます。

機密情報にはそれぞれ固有の識別子が割り当てられます。これらのトークンは、ほとんどの中間データ使用(機密データが収集された後、最終的に処分される前に使用)で実際のデータの代わりに使用でき、トークン化を解除する必要はありません。

トークン化は、組織がコンプライアンス要件を満たすのにも役立ちます。例えば、多くの医療機関は、医療保険の携行性と責任に関する法律(HIPAA)によって課せられるデータ・プライバシー・ルールに準拠するためにトークン化を使用しています。

一部のアクセス制御システムではデジタル・トークンも使用されます。例えば、トークンベースの認証プロトコルでは、ユーザーは自分の身元を検証し、その代わりに保護されたサービスや資産にアクセスするために使用できるトークンを受け取ります。多くのアプリケーション・プログラミング・インターフェース(API)は、このようにトークンを使用します。

デジタル決済

銀行、 電子商取引webサイト、その他のアプリケーションでは、銀行口座番号、クレジットカード番号、その他の機密データを保護するためにトークン化がよく使用されます。

支払い処理中、トークン化システムは、クレジットカード情報、プライマリー・アカウント番号(PAN)、またはその他の財務データの代わりに支払いトークンを使用できます。

このトークン化プロセスにより、購入と財務情報の間のリンクが削除され、顧客の機密データが悪意のある行為者から保護されます。

自然言語処理(NLP)

トークン化は、自然言語処理(NLP)で使用される前処理手法です。NLPツールは通常、単語、条項、文、段落などの言語単位でテキストを処理します。したがって、NLPアルゴリズムでは、まず大きなテキストをNLPツールが処理できる小さなトークンに分割する必要があります。トークンは、アルゴリズムが理解できる方法でテキストを表します。

この図は、NLPアルゴリズムがテキストをトークンのコレクションに分割する方法を示しています。
この図は、NLPアルゴリズムがテキストをトークンのコレクションに分割する方法を示しています。

コンプライアンス要件

データトークン化により、組織は政府の規制要件や業種・業務の標準規格に準拠することができます。多くの組織では、PIIを保護するために、非破壊的難読化の形式としてトークン化を使用しています。

例えば、PCI DSS(Payment Card Industry Data Security Standard)では、企業がカード所有者データを保護するためにサイバーセキュリティー要件を満たすことを義務付けています。プライマリー・アカウント番号のトークン化は、組織がこれらの要件に準拠するために実行できる手順の1つです。トークン化は、組織が EU の一般データ保護規則(GDPR)で定められたデータ・プライバシー・ルールを遵守するのにも役立ちます。

資産のトークン化

トークンは、有形か無形かを問わず、資産を表すために使用できます。トークン化された資産は、実際の資産よりも安全で移動や取引が簡単な場合が多く、組織は取引を自動化し、業務を効率化し、資産の流動性を高めることができます。

トークンで表される具体的な資産には、アートワーク、設備、不動産などがあります。有形資産には、債券や株式と同様のROIが約束されるデータ、知的財産、またはセキュリティー・トークンが含まれます。非代替性トークン(NFT)を使用すると、アート、音楽、デジタル収集品などのデジタル資産を購入できます。

ブロックチェーン

トークン・ベースのブロックチェーンテクノロジーにより、取引時間と決済の間に遅延が発生する可能性のある従来の方法とは異なり、単一の取引で所有権と価値の移転が可能になります。スマート・コントラクトは、ブロックチェーン上のトークン転送やその他のトランザクションを自動化するのに役立ちます。

暗号通貨は、暗号トークンを使用して、ブロックチェーン上の資産または利息をトークン化できます。ステーブル・コインと呼ばれる資産担保トークンは、仲介業者やエスクロー口座を排除することでビジネスプロセスを最適化できます。

トークン化と暗号化

トークン化により、機密データが機密性の低い(そしてそれがなければ役に立たない)文字の文字列に置き換えられます。暗号化により、データはスクランブル化され、復号化キーと呼ばれる秘密キーを使用して解読できるようになります。

トークン化と暗号化はどちらもデータ保護に役立ちますが、多くの場合、使用ケースは異なります。トークン化は、定期的な支払いの支払いデータの保管など、元のデータを簡単に置き換えることができる状況でよく使用されます。暗号化は、保管中および転送中のデータを保護するなど、元のデータへのアクセスが重要な状況でよく使用されます。

トークン化は暗号化よりもリソースをあまり消費しないプロセスです。トークン化ではデータを機密性のないトークンと交換するだけで済みますが、暗号化システムではデータの使用時に定期的な暗号化と復号化が必要になり、コストがかかる可能性があります。

関連ソリューション
データ・セキュリティーと保護ソリューション

複数の環境にまたがるデータを保護し、プライバシー規制を満たし、複雑な運用を簡素化します。

    データ・セキュリティーソリューションの詳細はこちら
    IBM Guardium

    オンプレミスとクラウドの機密データを保護するデータ・セキュリティー・ソフトウェア・ファミリーであるIBM Guardiumの詳細をご覧ください。

     

      IBM Guardiumの詳細はこちら
      データ・セキュリティー・サービス

      IBMは、エンタープライズ・データ、アプリケーション、AIを保護するための包括的なデータ・セキュリティー・サービスを提供します。

      データ・セキュリティー・サービスの詳細はこちら
      次のステップ

      データ・セキュリティー・ソリューションを使用して、組織のデータをハイブリッドクラウド全体で保護し、コンプライアンス要件を簡素化します。

      データ・セキュリティーソリューションの詳細はこちら デモを予約