多重代入

多重代入の目的は、欠損値に対し適用可能な値を生成することで、データの「完全な」セットを複数作成することです。多重代入データ・セットを処理する分析プロシージャーは、「完全な」データ・セットごとに出力を作成します。加えて、元のデータ・セットに欠損値がなかったらどのような結果になっていたかを推定するプール出力も作成します。このようにしてプールされた結果は、一般に、複数回にわたる単一代入法で生成された結果よりも正確です。

多重代入データでの考慮事項

分析変数。分析変数として可能なものは以下のとおりです。

変数リストで各変数の隣にあるアイコンは、以下のような尺度とデータ型を表します。

表 1. 測定レベルのアイコン
  数値 文字列 日付 時間
スケール (連続)
スケールのアイコン
なし
スケール日付のアイコン
スケール時間のアイコン
順序
順序のアイコン
順序の文字列
icon
順序の日付のアイコン
順序の時間のアイコン
名義
名義のアイコン
名義の文字列のアイコン
名義の日付のアイコン
名義の時間のアイコン

度数による重み付け: 度数による重み付け (反復重み付け) は、このプロシージャーで処理します。反復重み付けの値が負または 0 であるケースは無視されます。非整数である重み付けは、最も近い整数に丸められます。

分析の重み付け: 分析 (回帰または抽出) 重み付けは、欠損値の集計および代入モデルの当てはめに組み込まれています。分析重み付けが負または 0 であるケースは除外されます。

コンプレックス・サンプル。「多重代入」プロシージャーでは、階層、クラスターその他のコンプレックス・サンプル構造を明示的に処理するわけではありませんが、最終的な標本の重み付けは、分析重み付け変数の形式で受け入れることができます。また、「コンプレックス・サンプル」プロシージャーは現時点で、多重代入されたデータ・セットを自動的には分析しない、ということに注意してください。 プールをサポートするプロシージャーの完全なリストについては、多重代入データの分析を参照してください。

欠損値。ユーザー欠損値とシステム欠損値のいずれも、無効値として扱われます。つまり、いずれのタイプの欠損値も、値が代入されると置き換えられ、代入モデルでの予測値として使用される変数の無効値として扱われます。欠損値の分析では、ユーザー欠損値もシステム欠損値もまた、欠損として取り扱われます。

結果の複製 (欠損データ値の代入)。代入の結果を正確に複製するには、使用するプロシージャーの設定を同じにするのに加え、使用する乱数ジェネレーターの初期化の値、データの順序、変数の順序も同じにします。

多重代入専用のダイアログは 2 つあります。

これらのダイアログでは、MULTIPLE IMPUTATION コマンド・シンタックスを貼り付けます。