Genelleştirilmiş Doğrusal Modeller

Genelleştirilmiş doğrusal model, genel doğrusal modeli genişletir, böylece bağımlı değişken belirli bir link fonksiyonu aracılığıyla katsayılarla doğrusal olarak ilişkilendirilir ve kovaryantlar oluşturur. Ayrıca, model, bağımlı değişkenin normal olmayan bir dağılıma sahip olmasına izin verir. Normal dağılmış yanıtlar için doğrusal regresyon, ikili veriler için lojistik modeller, sayım verileri için loglineer modeller, aralık sansürlü hayatta kalma verileri için tamamlayıcı log-log modelleri ve çok genel model formülasyonu aracılığıyla diğer birçok istatistiksel model gibi yaygın olarak kullanılan istatistiksel modelleri kapsar.

Örnekler. Bir nakliye şirketi, bir Poisson regresyonuna farklı zaman dilimlerinde inşa edilen gemilerin çeşitli türlerine zarar vermek için genelleştirilmiş doğrusal modeller kullanabilir ve ortaya çıkan model, hangi gemi tiplerinin hasar almaya en yatkın olduğunu belirlemeye yardımcı olabilir.

Bir otomobil sigorta şirketi, arabaların hasar taleplerine gama regresyonu uyması için genelleştirilmiş doğrusal modeller kullanabilir ve sonuçta ortaya çıkan model, talep boyutuna en fazla katkıda bulunan faktörlerin belirlenmesine yardımcı olabilir.

Medikal araştırmacılar, tıbbi bir durum için tekrarlama süresini tahmin etmek için tamamlayıcı bir log-log regresyonunu aralık sansürlü hayatta kalma verilerine sığdırmak için genelleştirilmiş doğrusal modelleri kullanabilir.

Genelleştirilmiş Doğrusal Modeller Verileriyle İlgili Önemli Noktalar

Veri. Yanıt ölçek, sayı, ikili değer ya da denemelerdeki olaylar olabilir. Faktörlerin kategorik olduğu varsayılır. Kovaryasyonlar, ölçek ağırlığı ve göreli konumun ölçek olduğu varsayılır.

Varsayımlar. Vakaların bağımsız gözlemler olduğu varsayılır.

Genelleştirilmiş Doğrusal Model Elde Etmek İçin

Bu özellik için Özel Çizelgeler ve Gelişmiş İstatistiklergerekir.

Menülerden şunları seçin:

Çözümleme > Genelleştirilmiş Doğrusal Modeller > Genelleştirilmiş Doğrusal Modeller ...

  1. Bir dağıtım ve bağlantı işlevi belirtin (çeşitli seçeneklere ilişkin ayrıntılar için aşağıya bakın).
  2. Yanıt etiketinde bağımlı bir değişken seçin.
  3. Tahmine dayalı değişkenler sekmesinde, bağımlı değişkeni tahmin etmek için kullanılacak katsayıları ve kovaryasyonları seçin.
  4. Model sekmesinde, seçilen katsayıları ve kovaryasyonları kullanarak model etkilerini belirtin.

Model Tipi sekmesi, modelinize ilişkin dağıtım ve bağlantı işlevini belirtmenize olanak sağlar ve yanıt tipine göre sınıflandırılan birkaç ortak model için kısa kesimler sağlar.

Model Tipleri

Yanıtı Ölçekle. Aşağıdaki seçenekler kullanılabilir:

  • Doğrusal. Bağlantı işlevi olarak, Dağıtım ve Kimlik olarak Olağan 'ı belirtir.
  • Günlük bağlantısıyla Gamma. Gama 'yı dağıtım olarak belirler ve bağlantı işlevi olarak günlüğe kaydet.

Ordinal Response (Sırasal Yanıt). Aşağıdaki seçenekler kullanılabilir:

  • Ordinal lojistik. Dağılım olarak Multinomial (ordinal) ve link işlevi olarak Cumulative logit olarak belirtir.
  • Ordinal probit (Ordinal probit). Bağlantı işlevi olarak dağılım ve Kümülatif probit olarak Multinomial (ordinal) öğesini belirtir.

Sayım. Aşağıdaki seçenekler kullanılabilir:

  • Poisson loglinear. Dağıtım olarak Poisson ve bağlantı işlevi olarak Log 'u belirtir.
  • Negatif binom ve günlük bağlantısı. Bağlantı işlevi olarak dağıtım ve Günlük olarak negatif binom (yardımcı parametre için 1 değeri ile) değerini belirtir. Yordamın yardımcı parametrenin değerini tahmin etmesi için Negatif binom dağılımı olan özel bir model belirtin ve Parametre grubunda Tahmin değeri ' ni seçin.

İkili Yanıt ya da Olaylar/Denemeler Verileri. Aşağıdaki seçenekler kullanılabilir:

  • İkili lojistik. Dağılım olarak Binomial 'ı, bağlantı işlevi olarak Logit 'ı belirtir.
  • İkili probit. Binomial 'ı dağıtım olarak ve Probit 'ı bağlantı işlevi olarak belirtir.
  • Aralık sansürlü hayatta kalma süresi. Bağlantı işlevi olarak dağıtım ve Tamamlayıcı günlük günlüğü olarak Binomial 'ı belirtir.

Karışım. Aşağıdaki seçenekler kullanılabilir:

  • Günlük bağlantısıyla tweedie. Bağlantı işlevi olarak dağıtım ve Günlük olarak Tweedie 'yi belirtir.
  • Kimlik bağlantısıyla tweedie. Bağlantı işlevi olarak dağıtım ve Kimlik olarak Tweedie 'yi belirtir.

Özel. Kendi dağıtım ve bağ işlevi birleşiminizi belirleyin.

Dağıtım

Bu seçim, bağımlı değişkenin dağılımını belirtir. Normal olmayan bir dağılım ve kimlik dışı bağlantı fonksiyonu belirtme becerisi, genelleştirilmiş doğrusal modelin genel doğrusal modele göre önemli bir gelişimini sağlar. Birçok olası dağılım-bağlantı fonksiyonu kombinasyonu vardır ve herhangi bir veri kümesi için uygun olabilir, bu nedenle seçiminiz bir priori teorik hususlar veya hangi kombinasyonun en uygun göründüğü ile yönlendirilebilir.

  • İkili. Bu dağıtım yalnızca ikili bir yanıtı ya da olay sayısını gösteren değişkenler için uygundur.
  • Gama. Bu dağılım, daha büyük pozitif değerlere doğru eğilmiş pozitif ölçek değerlerine sahip değişkenler için uygundur. Bir veri değeri 0 'dan küçük ya da 0 'a eşitse ya da eksikse, analizde ilgili vaka kullanılmaz.
  • Ters Gauss. Bu dağılım, daha büyük pozitif değerlere doğru eğilmiş pozitif ölçek değerlerine sahip değişkenler için uygundur. Bir veri değeri 0 'dan küçük ya da 0 'a eşitse ya da eksikse, analizde ilgili vaka kullanılmaz.
  • Negatif binom. Bu dağılım, k başarısının gözlemlenmesi için gereken deneme sayısı olarak düşünülebilir ve negatif olmayan tamsayı değerleri olan değişkenler için uygundur. Bir veri değeri tamsayı olmayan, 0 'dan küçük ya da eksikse, çözümlemede ilgili vaka kullanılmaz. Negatif binom dağılımının yan parametre değeri 0 'dan büyük ya da 0 'a eşit herhangi bir sayı olabilir; bunu sabit bir değere ayarlayabilir ya da yordam tarafından tahmin edilmesine izin verebilirsiniz. Yan parametre 0 olarak ayarlandığında, bu dağılımın kullanılması Poisson dağıtımının kullanılmasıyla eşdeğerdir.
  • Normal. Bu, değerleri merkezi (ortalama) bir değer hakkında simetrik, çan şeklinde bir dağılım alan ölçek değişkenleri için uygundur. Bağımlı değişken sayısal olmalıdır.
  • Poisson. Bu dağılım, bir olayın sabit bir zaman diliminde oluşma sayısı olarak düşünülebilir ve negatif olmayan tamsayı değerleri olan değişkenler için uygundur. Bir veri değeri tamsayı olmayan, 0 'dan küçük ya da eksikse, çözümlemede ilgili vaka kullanılmaz.
  • Tweedie. Bu dağılım, gama dağılımlarının Poisson karışımları ile temsil edilebilen değişkenler için uygundur; dağılım, sürekli (negatif olmayan reel değerleri alır) ve ayrık dağılımların (tek bir değerde pozitif olasılık kütlesi, 0) özelliklerini birleştirmesi anlamında "karışık" dır. Bağımlı değişken sayısal olmalıdır; veri değerleri sıfırdan büyük ya da sıfıra eşit olmalıdır. Bir veri değeri sıfırdan küçük ya da eksikse, analizde ilgili vaka kullanılmaz. Tweedie dağılımının parametresinin sabit değeri, birden büyük ve ikiden küçük herhangi bir sayı olabilir.
  • Çok terimli. Bu dağıtım, sıralı bir yanıtı temsil eden değişkenler için uygundur. Bağımlı değişken sayısal ya da dizgi olabilir ve en az iki ayrı geçerli veri değeri olmalıdır.

Bağlantı İşlevleri

Bağlantı işlevi, modelin tahmin edilmesine izin veren bağımlı değişkenin bir dönüşümdür. Aşağıdaki işlevler kullanılabilir:

  • Kimliği. f(x) =x. Bağımlı değişken dönüştürülmedi. Bu bağlantı herhangi bir dağıtımla birlikte kullanılabilir.
  • Tamamlayıcı günlük günlüğü. f(x) =log (−log (1−x)). Bu yalnızca binom dağılımına uygundur.
  • Cumulative Cauchit (Kümülatif cauchit). f(x) = tan (π (x - 0.5)), yanıtın her kategorisinin kümülatif olasılığına uygulanır. Bu yalnızca çok terimli dağılıma uygundur.
  • Birikimli tamamlayıcı günlük günlüğü. f(x) =ln (−ln (1−x)), yanıtın her kategorisinin kümülatif olasılığına uygulanır. Bu yalnızca çok terimli dağılıma uygundur.
  • Birikmeli logit. f(x) = ln (x /(1−x)), yanıtın her kategorisinin kümülatif olasılığına uygulanır. Bu yalnızca çok terimli dağılıma uygundur.
  • Birikmeli negatif günlük günlüğü. f(x) = −ln (x)), yanıtın her kategorisinin kümülatif olasılığına uygulanır. Bu yalnızca çok terimli dağılıma uygundur.
  • Birikimli probit. f(x) = Allah−1(x), verilen yanıtın her kategorisinin kümülatif olasılığına uygulanır. Burada, örn.−1 ters standart normal kümülatif dağılım fonksiyonudur. Bu yalnızca çok terimli dağılıma uygundur.
  • Günlük. f(x) = log (x). Bu bağlantı herhangi bir dağıtımla birlikte kullanılabilir.
  • Günlük tamamlama. f(x) =log (1−x). Bu yalnızca binom dağılımına uygundur.
  • Logit. f(x) = log (x /(1−x)). Bu yalnızca binom dağılımına uygundur.
  • Negatif binom. f(x) = log (x /(x+k − 1)); burada k , negatif binom dağılımının yan parametresidir. Bu yalnızca negatif binom dağılımı için uygundur.
  • Negatif günlük günlüğü. f(x) = −log (x)). Bu yalnızca binom dağılımına uygundur.
  • Olasılık gücü. f(x) = [ (x/(1−x))α− 1 ]/α, eğer α ≠ 0 ise. f(x) = log (x) (α=0 ise). α, gerekli sayı belirtimidir ve gerçek bir sayı olmalıdır. Bu yalnızca binom dağılımına uygundur.
  • Probit (Probit). f(x)=Φ−1(x), where Φ−1 is the inverse standard normal cumulative distribution function. Bu yalnızca binom dağılımına uygundur.
  • Güç. f(x) =x α, eğer α ≠ 0 ise. f(x) = log (x) (α=0 ise). α, gerekli sayı belirtimidir ve gerçek bir sayı olmalıdır. Bu bağlantı herhangi bir dağıtımla birlikte kullanılabilir.

Bu yordam, GENLIN komutunun sözdizimini yapıştırır.