Doğrusal regresyon nedir?

Doğrusal regresyon analizi, bir değişkenin değerini başka bir değişkenin değerine göre tahmin etmek için kullanılır. Tahmin etmek istediğiniz değişken, bağımlı değişken olarak adlandırılır. Diğer değişkenin değerini tahmin etmek için kullandığınız değişken ise bağımsız değişken olarak adlandırılır.

Bu analiz biçimi, bağımlı değişkenin değerini en iyi öngören bir ya da daha fazla bağımsız değişkeni kullanarak doğrusal denklemin katsayılarını tahmin eder. Doğrusal regresyon, öngörülen ve gerçek çıkış değerleri arasındaki uyumsuzlukları en aza indiren düz bir çizgi ya da yüzeye yerleşir. Bir çift eşleştirilmiş veri kümesi için en uygun satırı keşfetmek üzere "en küçük kareler" yöntemini kullanan basit doğrusal regresyon hesaplayıcılar vardır. Daha sonra, Y'den (bağımsız değişken) X'in (bağımlı değişken) değerini tahmin edersiniz.

Doğrusal regresyon dağılım grafiği örneği

Tahminleri daha kolay üretin

Microsoft Excel içinde doğrusal regresyon gerçekleştirebilir ya da doğrusal regresyon denklemlerini, doğrusal regresyon modellerini ve doğrusal regresyon formüllerini kullanma sürecini önemli ölçüde basitleştiren IBM SPSS® Statistics gibi istatistiksel yazılım paketlerini kullanabilirsiniz. SPSS Statistics, basit doğrusal regresyon ve çoklu doğrusal regresyon gibi tekniklerde kullanılabilir.

Doğrusal regresyon yöntemini aşağıdakiler dahil, çeşitli programlar ve ortamlarda yürütebilirsiniz:

  • R doğrusal regresyonu
  • MATLAB doğrusal regresyonu
  • Sklearn doğrusal regresyonu
  • Python doğrusal regresyonu
  • Excel doğrusal regresyonu

Doğrusal regresyon neden önemlidir?

Doğrusal regresyon modelleri nispeten basittir ve tahminler üretebilen, yorumlanması kolay bir matematiksel formül sağlar. Doğrusal regresyon, iş dünyasında ve akademik çalışmalardaki çeşitli alanlara uygulanabilir.

Doğrusal regresyonun biyolojik, davranışsal, çevresel ve sosyal bilimlerden iş dünyasına kadar her alanda kullanıldığını görebilirsiniz. Doğrusal regresyon modelleri, bilimsel olarak kanıtlanmış bir yöntem haline gelmiştir ve bunlar geleceği güvenilir bir şekilde öngörür. Doğrusal regresyon köklü bir istatistiksel prosedür olduğu için, doğrusal regresyon modellerinin özellikleri iyi anlaşılabilir ve çok çabuk eğitebilir.

Geleceği bilimsel olarak ve güvenilir bir şekilde öngörmek için kanıtlanmış bir yöntem

İşletme ve kuruluş liderleri, doğrusal regresyon tekniklerini kullanarak daha iyi kararlar alabilirler. Kuruluşlar büyük miktarlarda veri toplarlar ve doğrusal regresyon, deneyimlere ve sezgiye güvenmek yerine, gerçekliği daha iyi yönetmeleri için bu verileri kullanmalarında onlara yardımcı olur. Büyük miktarda ham veriyi alıp eyleme dönüştürülebilecek bilgiler haline getirebilirsiniz.

İş arkadaşlarınızın daha önce zaten anladıklarını görmüş ve düşünmüş olabilecekleri kalıpları ve ilişkileri ortaya çıkararak daha iyi içgörüler sağlamak için de doğrusal regresyondan yararlanabilirsiniz. Örneğin, satış ve satın alma verilerini analiz etmek, belirli günlerdeki ya da belirli saatlerdeki belirli satın alma kalıplarını ortaya çıkarmanıza yardımcı olabilir. Regresyon analizinden toplanan içgörüler, iş liderlerinin şirketlerinin ürünlerinin yüksek talep göreceği zamanları tahmin etmelerine yardımcı olabilir.

→ IBM Knowledge Center'da doğrusal regresyon hakkında daha fazla bilgi edinin

Etkili doğrusal regresyonun temel varsayımları

Doğrusal regresyon analizinde başarı için göz önünde bulundurulması gereken varsayımlar:

  • Her bir değişken için: Geçerli vakaların sayısını, ortalama ve standart sapmayı hesaba katın.  
  • Her bir model için: Regresyon katsayıları, korelasyon matrisi, parça ve kısmi korelasyonları, birden çok R, R2, ayarlanmış R2, R2'deki değişim, standart tahmin hatası, varyans analizi tablosu, beklenen değerler ve artık değerleri göz önünde bulundurun. Ayrıca, her bir regresyon katsayısı için yüzde 95'lik güven aralıkları, varyans kovaryans matrisi, varyans enflasyon katsayısı, tolerans, Durbin-Watson testi, uzaklık ölçümleri (Mahalanois, Cook ve kaldırma değerleri), DfBeta, DfFit, öngörü aralıkları ve vaka genelindeki tanılama bilgilerini göz önünde bulundurun. 
  • Grafikler: Dağılım grafiklerini, kısmi grafikleri, histogramları ve normal olasılık grafiklerini değerlendirin.
  • Veriler: Bağımlı ve bağımsız değişkenlerin nicel olması gerekir. Din, çalışma alanı veya ikamet bölgesi gibi kategorik değişkenlerin ikili (göstermelik) değişkenlere veya diğer karşıtlık değişkenlerine yeniden kodlanması gerekir.  
  • Diğer varsayımlar: Bağımsız değişkenin her değeri için, bağımlı değişkenin dağılımı normal olmalıdır. Bağımlı değişkenin dağılımının varyansı, bağımsız değişkenin tüm değerleri için sabit olmalıdır. Bağımlı değişken ile her bir bağımsız değişken arasındaki ilişki doğrusal olmalı ve tüm gözlemlerin bağımsız olmalıdır.

Verilerinizin doğrusal regresyon varsayımlarınızı karşıladığından emin olun

Doğrusal regresyon gerçekleştirmeyi denemeden önce, verilerinizin bu yordam kullanılarak analiz edilebileceğinden emin olmanız gerekir. Verilerinizin bazı zorunlu varsayımlardan geçmesi gerekir.

Bu varsayımları nasıl kontrol edebileceğiniz aşağıda belirtilmiştir:

  1. Değişkenler sürekli bir düzeyde ölçülmelidir. Sürekli değişkenlere örnek olarak zaman, satış, ağırlık ve test puanları verilebilir.  
  2. Bu iki değişken arasında doğrusal bir ilişki olup olmadığını hızlı bir şekilde bulmak için bir dağılım grafiği kullanın.
  3. Gözlemler birbirinden bağımsız olmalıdır (yani bağımlılık olmaması gerekir).
  4. Verilerinizde önemli aykırı değerler olmamalıdır. 
  5. En uygun doğrusal regresyon çizgisi üzerindeki varyansların ilgili çizginin tamamında aynı olarak kaldığını belirten bir istatistik kavramı olan homoskedastisiteyi (eş varyanslılık) kontrol edin.
  6. En uygun regresyon çizgisinin artık değerleri (hatalar), normal dağılımı izler.

→ Doğrusal regresyon veri varsayımları hakkında daha fazla bilgi edinmek için bu uygulamalı öğretici programı kullanın (bağlantı IBM dışındadır)

Doğrusal regresyonun başarısına örnekler

Eğilimlerin ve satış tahminlerinin değerlendirilmesi

Doğrusal regresyon analizini, yaş, eğitim ve deneyim süresi gibi bağımsız değişkenlerden, bir satış görevlisinin toplam yıllık satışını (bağımlı değişken) öngörmek için de kullanabilirsiniz.

Fiyatlandırma esnekliğinin analiz edilmesi

Fiyatlandırmadaki değişiklikler sıklıkla tüketici davranışlarını etkiler ve doğrusal regresyon bu etkiyi analiz etmenize yardımcı olabilir. Örneğin belirli bir ürünün fiyatı sürekli değişiyorsa, fiyat arttıkça tüketimin düşüp düşmediğini görmek için regresyon analizini kullanabilirsiniz. Fiyatlar arttıkça, tüketim önemli ölçüde düşmezse ne olur? Alıcılar hangi fiyat noktasında ürünü satın almayı bırakır? Bu bilgiler, perakende işindeki liderler için çok yararlı olacaktır.

Sigorta şirketinde risklerin değerlendirilmesi

Doğrusal regresyon teknikleri riskleri analiz etmek için kullanılabilir. Örneğin bir sigorta şirketini, ev sahiplerinin sigorta taleplerinin soruşturulması için sınırlı kaynaklara sahip olabilir; doğrusal regresyon sayesinde, şirketin ekibi taleplerin maliyetlerini tahmin etmek için bir model oluşturabilir. Bu analiz, şirket liderlerine hangi risklerin alınabileceğiyle ilgili önemli kararlar vermelerine yardımcı olabilir.

Spor analizi

Doğrusal regresyon her zaman sadece iş dünyasında kullanılmaz. Sporda da önemli bir role sahiptir. Örneğin, bir basketbol takımının sezon içinde kazandığı maçların sayısının, takımın maç başına aldığı ortalama puan sayısı ile ilişkili olup olmadığını merak ediyor olabilirsiniz. Dağılım grafiği, bu değişkenlerin doğrusal olarak ilişkili olduğunu gösterir. Kazanılan maç sayısı ve rakibin aldığı ortalama puan sayısı da doğrusal olarak ilişkilidir. Bu değişkenlerde negatif bir ilişki vardır. Kazanılan maç sayısı artıkça, rakibin aldığı ortalama puan sayısı düşmektedir. Doğrusal regresyonu kullanarak bu değişkenlerin ilişkisini modelleyebilirsiniz. İyi bir model, takımın kaç tane maç kazanacağını tahmin etmek için kullanılabilir.

Doğrusal regresyon ürünleri

IBM SPSS Statistics yazılımı

Bu hızlı ve güçlü çözüm ile araştırma ve analizi ileriye taşıyın.

IBM SPSS Statistics Grad Pack and Faculty Packs

Öğrenciler, öğretmenler ve araştırmacılar, tahmine dayalı analitik yazılımına uygun fiyatlı erişim elde edebilirler.

IBM Cognos® Statistics

Başarısı kanıtlanmış bu self servis analitik çözümü, verilerinizi karıştırıp eşleştirerek kullanmanıza ve etkili görselleştirmeler oluşturmanıza yardımcı olur.