一般化線型モデル

一般化線型モデルは、従属変数が、指定したリンク関数によって因子および共変量と線型の関係になるように一般線型モデルを拡張したものです。 さらにこのモデルでは、非正規分布の従属変数を使用することができます。 一般化線型モデルは、正規分布した回答の回帰、バイナリ データのためのロジスティック・モデル、計数データのための対数線型モデル、間隔を決めて検閲される延命データのための補数対数-対数モデルなどの広く使用される統計モデルに加えて、一般的なモデルの定式を通じて多くのほかの統計モデルも対象とします。

例: 出荷会社は、一般線形モデルを使用して、異なる期間に構成されたいくつかのタイプの船の損害数にポアソン回帰を適合させることができます。また、結果のモデルは、どの出荷タイプが最も損傷を受けるかを判別するのに役立ちます。

自動車保険会社は、一般線形モデルを使用して、自動車の損害請求に対するガンマ回帰を適合させることができ、結果のモデルは、請求サイズに最も影響を与える要因を判別するのに役立ちます。

医学研究者は、一般線形モデルを使用して、間隔を検閲しない生存データに対する補完的な対数ログ回帰に適合させることができ、病状の再発を予測することができます。

一般化線型モデルのデータの考慮事項

データ: 応答には、スケール、度数、2 値、または試行におけるイベントがあります。 因子はカテゴリー型と見なされます。 共変量、スケール重み付け、およびオフセットはスケールと見なされます。

仮定: ケースは独立した観測値と見なされます。

一般化線型モデルを取得するには

この機能を使用するには、SPSS®Statistics Standard Edition または Advanced Statistics オプションが必要です。

メニューから次の項目を選択します。

「分析」 > 「一般化線型モデル」 > 「一般化線型モデル...」

  1. 分布およびリンク関数を指定します (各種オプションの詳細については下記参照)。
  2. 「応答」タブで、従属変数を選択します。
  3. 「予測」タブで、従属変数の予測に使用する因子と共変量を選択します。
  4. 「モデル」タブで、選択した因子および共変量を使用してモデル効果を指定します。

「モデルの種類」タブでは、モデルに対して分布およびリンク関数を指定でき、応答の種類によって分類されているいくつかの一般的なモデルに対してショートカットが提供されます。

モデル・タイプ

スケール応答。 使用可能なオプションは次のとおりです。

  • 線型: 分布に「正規」、リンク関数に「同一」を指定します。
  • 対数リンクを使用するガンマ 。分布に「ガンマ」、リンク関数に「対数」を指定します。

順序応答。 使用可能なオプションは次のとおりです。

  • 順序ロジスティック 。分布に「多項 (順序)」、リンク関数に「累積ロジット」を指定します。
  • 順序プロビット 。分布に「多項 (順序)」、リンク関数に「累積プロビット」を指定します。

度数。 使用可能なオプションは次のとおりです。

  • ポワソン対数線型。 分布に「ポワソン」、リンク関数に「対数」を指定します。
  • 対数リンクを使用した負の 2 項。 分布に「負の 2 項 (補助パラメーターに 1 の値)」、リンク関数に「対数」を指定します。 補助パラメーターの値を推定するプロシージャーにするには、「負の 2 項分布」のカスタム・モデルを指定し、パラメーター・グループで「推定値」を選択します。

2 値応答またはイベント/試行データ。 使用可能なオプションは次のとおりです。

  • 2 値ロジスティック。 分布に「2 項」、リンク関数に「ロジット」を指定します。
  • 2 値プロビット。 分布に「2 項」、リンク関数に「プロビット」を指定します。
  • 打ち切り。 分布に「2 項」、リンク関数に「補ログ・マイナス・ログ」を指定します。

混合。 使用可能なオプションは次のとおりです。

  • 対数リンクを使用した Tweedie。 分布に「Tweedie」、リンク関数に「対数」を指定します。
  • 同一リンクを使用した Tweedie。 分布に「Tweedie」、リンク関数に「同一」を指定します。

カスタム 。独自の分布とリンク関数の組み合わせを指定します。

分布

このセクションで、従属変数の分布を指定します。 非正規分布と非恒等式リンク関数を指定する機能は、一般化線型モデルの従来の機能を越える、本質的な機能の向上です。 分布とリンク関数には多くの組み合わせの可能性があり、その中のいくつかは特定のデータセットに適切な場合があるので、この選択が先験的な理論考察または一番適合するように見える組み合わせによって導き出される可能性があります。

  • 2 項。 この分布は、二者択一の回答またはイベント数を表す変数に対してのみ、適しています。
  • ガンマ。 この分布は、正の値が大きくなるほどゆがむ正のスケール値を持つ変数に適しています。 データ値が 0 以下または欠損値である場合、対応するケースは分析には使用されません。
  • 逆ガウス。 この分布は、正の値が大きくなるほどゆがむ正のスケール値を持つ変数に適しています。 データ値が 0 以下または欠損値である場合、対応するケースは分析には使用されません。
  • 負の 2 項。 この分布は k の成功を観測するために必要な試行回数として考えることができ、負ではない整数値の変数に適しています。 データ値が非整数である、0 未満である、または欠損値の場合、対応するケースは分析に使用されません。 負の 2 項分布の補助パラメーターの値は、0 以上の数値ですが、パラメーターに固定値を設定し、プロシージャーで推定することも可能です。 補助パラメーターが 0 に設定されると、この分布を使用することはポワソン分布を使用することに相当します。
  • 正規。 これは、値が対称で、中心 (平均) 値に関してベル型の分布であるスケール変数に適しています。 従属変数は数値型である必要があります。
  • ポワソン。 この分布は一定期間の対象のイベントの発生回数として考えることができ、負ではない整数値の変数に適しています。 データ値が非整数である、0 未満である、または欠損値の場合、対応するケースは分析に使用されません。
  • Tweedie。 分布の「混合」とは連続型 (負でない十数値) と離散型 (単一値 0 の 正の確率質量) の特性を結合することです。 従属変数は数値型で 0 以上のデータ値である必要があります。 データ値が 0 未満である、または欠損値の場合、対応するケースは分析には使用されません。 Tweedie 分布のパラメーターの固定値は 1 以上 2 以下のどんな数字でもかまいません。
  • 多項。 この分布は順序型応答を表す変数に適しています。 従属変数は数値または文字列のどちらかで、少なくとも 2 つの異なる有効データ値を持つ必要があります。

リンク関数

リンク関数は従属変数の変換を行い、それによりモデルの推定ができます。 次の関数を使用することができます。

  • Identity. f(x)=x. 従属変数は変換されません。 このリンクはどの分布でも使用できます。
  • 補ログ・マイナス・ログ。 f(x)=log(−log(1−x))。 これは 2 項分布にのみ適しています。
  • 累積コーチット f(x) = tan(π (x - 0.5))。これは、応答の各カテゴリーの累積確率に適用されます。 これは多項分布にのみ適しています。
  • 累積的な負の両対数 f(x)=−ln(−ln(x)) 、ここでは応答の各カテゴリーの累積確率に適用されます。 これは多項分布にのみ適しています。
  • 累積ロジットf(x)=ln(x / (1−x))。応答の各カテゴリーの累積確率に適用されます。 これは多項分布にのみ適しています。
  • 累積的な負の両対数 f(x)=−ln(−ln(x))、これは応答の各カテゴリーの累積確率に適用されます。 これは多項分布にのみ適しています。
  • 累積プロビットf(x)=Φ−1(x)。応答の各カテゴリーの累積確率に適用されます。Φ−1 は逆標準正規累積分布関数です。 これは多項分布にのみ適しています。
  • Log. f(x)=log(x). このリンクはどの分布でも使用できます。
  • Log complement. f(x)=log(1−x). これは 2 項分布にのみ適しています。
  • Logit. f(x)=log(x / (1−x)). これは 2 項分布にのみ適しています。
  • 負の 2 項分布 f(x)=ログ(x / (x+k −1))。これは、kは負の 2 項分布の補助パラメーターです。 これは負の 2 項分布にのみ適しています。
  • 負ログ・マイナス・ログ。 f(x)=−log(−log(x))。 これは 2 項分布にのみ適しています。
  • 奇数乗。α ≠ 0 である場合、 f(x)=[(x/(1−x))α−1]/α です。f(x)=ログ(x)(α=0 の場合) α は必要な数の指定であり、実数でなければなりません。 これは 2 項分布にのみ適しています。
  • Probit. f(x)=Φ−1(x)、ここでは Φ−1は、逆標準正規累積分布関数です。 これは 2 項分布にのみ適しています。
  • Power. f(x)=x α、α ≠ 0 であるとします。 f(x)=ログ(x)( α= 0の場合 ) α は必要な数の指定であり、実数でなければなりません。 このリンクはどの分布でも使用できます。

このプロシージャーでは、GENLIN コマンド・シンタックスを貼り付けます。