シーケンシャル・パターンの使用方法

通常、マーケット・バスケット分析は、大規模なファクト表またはその一部で実行されます。

そのような表には、少なくとも以下の列が含まれています。
  1. シーケンス ID (ユーザー ID やクレジット・カード番号など)
  2. トランザクション ID 列または時間 ID 列
  3. アイテム ID 列
ファクト表には、個々のトランザクション (つまり、購入したアイテムを含む、個々の購入注文) が含まれています。さらに、各トランザクションは 1 つのシーケンスに関連付けられています。ディスク使用量を節約するために、多くの場合、列には数値が使用されます。また、項目 ID と購入済み項目の名前または説明との関係を別の表に保管できます。このような表に含まれているシーケンスのトランザクションは、トランザクション ID や時間 ID でソートできます。

シーケンシャル・パターン分析を使用して、この表から頻出シーケンシャル・パターン (つまり、購入パターンのシーケンス) を検出できます。シーケンシャル・パターン分析は、その結果に基づいて、シーケンシャル・ルールを推定できます。

(A)(B)(C)
多くの顧客が、アイテム A を購入したトランザクションの後のトランザクションでアイテム B を購入し、その後のトランザクションでアイテム C を購入することを意味します。
(A B)(C)
多くの顧客が同じトランザクションでアイテム A と B を購入し、その後のトランザクションでアイテム C を購入することを意味します。