予測モデルの作成

IBM® SPSS® Statistics には、予測モデルを構築するための多数のプロシージャーが用意されています。この例では、「ダイレクト・マーケティング」オプションで選択できる「購入の傾向」機能を使用します。「購入の傾向」では、該当する目標結果に結果が 2 つしかない 2 項ロジスティック回帰モデルを作成します。この例では、テスト・メールを受け取った連絡先が、応答した (購入した) 場合と、応答しなかった (購入しなかった) 場合を示します。

「回帰」アドオン・オプションの「ロジスティック回帰」を使用すると、同様のモデルを作成できます。予測モデルを生成するプロシージャーの完全なリストについては、予測モデルを使用したデータのスコアリングを参照してください。

この例では、次の 2 つのデータ・ファイルを使用します。モデルを作成するために dmdata2.sav を使用してから、そのモデルを dmdata3.sav に適用します。詳しくは、トピック「サンプル・ファイル」を参照してください。

データ・ファイル dmdata2.sav を開きます。
このファイルには、テスト・メールを受け取った人のさまざまな人口統計上の特徴が含まれています。またそのメールに回答したかどうかについての情報も含んでいます。この情報はフィールド (変数) Responded に記録されています。 1 の値は、連絡先がメールに回答したことを示し、0 の値は連絡先が回答しなかったことを示します。
メニューから次の項目を選択します。
ダイレクト・マーケティング > 手法の選択
「購入の可能性が高い連絡先を選択する」を選択し、「続行」をクリックします。
図1：「購入の傾向」、「フィールド」タブ
「回答フィールド」で「テスト・オファーに回答済み」を選択します。
「正の回答値」は、ドロップダウン・リストから「はい」を選択します。値1がテキスト・フィールドに表示されるのは、「はい」が、実際には、記録された値1に関連する値ラベルであるためです。 ( 正の回答値に定義済みの値ラベルがない場合は、テキスト・フィールドに値を入力するだけで済みます。)
「次を使用して傾向を予測」は、「年齢」、「収入カテゴリー」、「学歴」、「現住所の居住年月」、「性別」、「結婚」、「地域」、「子供」を選択します。
「モデル情報を XML ファイルにエクスポート」を選択 (チェック・マークを付ける) します。
「参照」をクリックして、ファイルを保存する場所に移動し、ファイルの名前を入力します。
「購入の傾向」ダイアログで、「設定」タブをクリックします。
図2：「購入の傾向」、「設定」タブ
「モデルの検証」グループで、「モデルの検証」および「シードを設定して結果を再現」を選択します (チェック・マークを付けます)。
50% のデフォルトの学習サンプル・データ区分サイズおよび 2000000 のデフォルト・シード値を使用します。
「診断出力」グループで、「全体のモデル品質」および「分類表」を選択します (チェック・マークを付けます)。
「最小確率」に「0.05」と入力します。一般的な規則として、対象応答率の最小値に近い値を比率で指定する必要があります。値 0.05 は、回答率 5% を示します。
「実行」をクリックしてプロシージャーを実行し、モデルを生成します。

次(X)