記述統計量

図1: 旧世代の記述統計 (サービスの月数)
旧世代の記述統計 (サービスの月数)

記述統計テーブルには、代入値を持つ変数の要約が表示されます。 変数ごとに個別のテーブルが作成されます。 表示される統計量のタイプは、変数がスケールかカテゴリーかによって異なります。

スケール変数の統計には、元のデータ、代入値の各セット、および完全なデータ・セット (元のデータと代入値を結合したもの) について表示される度数、平均値、標準偏差、最小値、および最大値が含まれます。

旧世代 (サービスの月数) の記述統計表には、元のデータの値とほぼ等しい代入値の各セットの平均値と標準偏差が表示されます。ただし、最小値を調べると、 旧世代 の負の値が代入されていることが分かります。

図2: 婚姻状況 (婚姻状況) の記述統計
婚姻状況 (婚姻状況) の記述統計

カテゴリー変数の場合、統計には、元のデータ、代入値、および完全なデータのカテゴリー別の度数とパーセントが含まれます。 「婚姻状況 (婚姻状況)」 の表には興味深い結果があり、代入された値については、元のデータよりも結婚していると推定されるケースの比率が高くなります。 これはランダム変動が原因である可能性があります。あるいは、欠落する可能性がこの変数の値に関連している可能性があります。

図3: 所得の記述統計 (世帯所得 (単位: 千))
所得の記述統計 (世帯所得 (単位: 千))

「保有期間」やその他のすべてのスケール変数と同様に、 「収入 (世帯収入 (千単位))」 には負の代入値が表示されます。特定の変数に対する制約を持つカスタム・モデルを明確に実行する必要があります。 ただし、 income は他の潜在的な問題を示しています。 各代入の平均値は元のデータの平均値よりもかなり高く、各代入の最大値は元のデータの平均値よりもかなり低くなります。 所得の分布は非常に正しく偏る傾向にあるため、これが問題の原因になる可能性があります。

次へ