相関ルールの背景
相関ルール・マイニングは、トランザクション内の高頻度パターンおよびルールを検出します。相関ルール・マイニングの既知のアルゴリズムは、Apriori または FP-Growth です。分析ストアード・プロシージャーの場合は、その拡張容易性のため PrefixSpan アルゴリズムが優先されます。
Apriori アルゴリズムは、連続反復を行うことによって高頻度項目セットを検索します。反復では、項目セットのサイズの増加が体系的に考慮されます。ただし、大規模データ・セットまたは低しきい値の場合は、識別された候補の数が圧倒的に多い可能性があります。
Apriori アルゴリズム以外の場合、PrefixSpan アルゴリズムは、パターンの完全なセットを検索しますが、不要な候補の作成を回避します。さらに、項目のソートや射影によって、射影されるデータベースのサイズが大幅に削減されます。また、これらのメソッドを使用すると、効率的な処理が行われます。