傾向性による類似度

方向性指標は、列変数値が分かっている場合に行変数値を予測する際の誤差の減少を定量化します (その逆も同様)。 各数値データには、単に「誤差」の異なる定義があります。
- Lambda は、ケースの誤分類として誤差を定義し、ケースはモーダル (最頻出) カテゴリーに従って分類されます。
- Tau は、誤差をケースの誤分類と定義し、ケースはカテゴリー jの観測度数に等しい確率でカテゴリー j に分類されます。
- 不確定性係数 は、変数のカテゴリーに対して合計されたエントロピーまたは P (カテゴリー j) * ln (P (カテゴリー j)) として誤差を定義します。 この不確定性係数は、テイルの U としても知られている。
連絡があった顧客の場合、Goodman と Kruskal のタウ値が 0.031 で、 「店舗」 に依存しているということは、誤分類が 3.1% 減少していることを意味します。 他の数値データ・レポートでは、 「店舗」 と 「サービス満足度」 の間の関連付けは、ほとんどの場合、店舗 2 のサービスが不十分であることが原因であることが示されています。