多重代入
多重代入の目的は、欠損値に対し適用可能な値を生成することで、データの「完全な」セットを複数作成することです。多重代入データ・セットを処理する分析プロシージャーは、「完全な」データ・セットごとに出力を作成します。加えて、元のデータ・セットに欠損値がなかったらどのような結果になっていたかを推定するプール出力も作成します。このようにしてプールされた結果は、一般に、複数回にわたる単一代入法で生成された結果よりも正確です。
多重代入データでの考慮事項
分析変数。分析変数として可能なものは以下のとおりです。
- Nominal (名義). 本質的な順位を持たないカテゴリーを表す値である場合 (従業員の勤務先企業での部署など)、 変数を名義変数として取り扱うことができます。名義変数の例としては、 地域、郵便番号、宗教上の所属などが挙げられます。
- Ordinal (順序データ). 値が本質的な順位を持つカテゴリーを表す場合 (例えば、サービス満足度のレベルを 「非常に不満」から「非常に満足」までの順位で評価する場合) は、 変数を順序変数として扱うことができます。順序変数の例としては、 満足度や信頼度を表す得点や嗜好得点などが挙げられます。
- Scale (スケール). 意味のある測定基準を持つ順序カテゴリーを値が表しており、
値の間の距離の比較が可能である場合は、
変数をスケール (連続型) として扱うことができます。スケール変数の例としては、
年齢や、千ドル単位で表した所得が挙げられます。
このプロシージャーでは、変数に割り当てられている測定レベルはすべて適切なものである、と仮定しますが、変数に対する測定レベルは一時的に変更することができます。そのためには、ソース変数リストで変数を右クリックし、ポップアップ・メニューから測定レベルを選択します。 変数に対する測定レベルを完全に変更する場合は、『変数の測定レベル』を参照してください。
変数リストで各変数の隣にあるアイコンは、以下のような尺度とデータ型を表します。
数値 | 文字列 | 日付 | 時間 | |
---|---|---|---|---|
スケール (連続) | |
なし | |
|
順序 | |
|
||
名義 |
度数による重み付け: 度数による重み付け (反復重み付け) は、このプロシージャーで処理します。反復重み付けの値が負または 0 であるケースは無視されます。非整数である重み付けは、最も近い整数に丸められます。
分析の重み付け: 分析 (回帰または抽出) 重み付けは、欠損値の集計および代入モデルの当てはめに組み込まれています。分析重み付けが負または 0 であるケースは除外されます。
コンプレックス・サンプル。「多重代入」プロシージャーでは、階層、クラスターその他のコンプレックス・サンプル構造を明示的に処理するわけではありませんが、最終的な標本の重み付けは、分析重み付け変数の形式で受け入れることができます。また、「コンプレックス・サンプル」プロシージャーは現時点で、多重代入されたデータ・セットを自動的には分析しない、ということに注意してください。 プールをサポートするプロシージャーの完全なリストについては、多重代入データの分析を参照してください。
欠損値。ユーザー欠損値とシステム欠損値のいずれも、無効値として扱われます。つまり、いずれのタイプの欠損値も、値が代入されると置き換えられ、代入モデルでの予測値として使用される変数の無効値として扱われます。欠損値の分析では、ユーザー欠損値もシステム欠損値もまた、欠損として取り扱われます。
結果の複製 (欠損データ値の代入)。代入の結果を正確に複製するには、使用するプロシージャーの設定を同じにするのに加え、使用する乱数ジェネレーターの初期化の値、データの順序、変数の順序も同じにします。
- 乱数の生成。このプロシージャーでは、代入値の計算時に乱数の生成を行います。ランダム化された結果として今後も同じものを再作成するには、「欠損データ値の代入」プロシージャーを実行するごとに事前に、乱数ジェネレーターに同じ初期化の値を使用します。詳しくは、乱数ジェネレーターのトピックを参照してください。
- ケースの並び順: 値はケースの順序に従って代入されます。
- 変数の順序。 完全条件指定 (FCS) 代入方法では、「分析変数」リストで指定された順序に従って値を代入します。
多重代入専用のダイアログは 2 つあります。
- パターン分析は、データにある欠損値のパターンの記述方法を提供します。これは、代入前の検討段階で有用です。
- 欠損データ値の代入は、多重代入を生成するのに使用します。多重代入データ・セットをサポートするプロシージャーで、完全なデータ・セットを分析することができます。多重代入データ・セットの分析、およびこうしたデータをサポートするプロシージャーのリストについては、多重代入データの分析を参照してください。
これらのダイアログでは、MULTIPLE IMPUTATION コマンド・シンタックスを貼り付けます。