Doğrusal regresyonda normalite varsayımı


11

Doğrusal regresyonun bir varsayımı olarak, hatanın dağılımının normalliği bazen yanlış bir şekilde "genişletilir" veya y veya x'in normalliğine duyulan ihtiyaç olarak yorumlanır.

X ve Y'nin normal olmadığı, ancak hata teriminin olduğu ve dolayısıyla elde edilen doğrusal regresyon tahminlerinin geçerli olduğu bir senaryo / veri seti oluşturmak mümkün müdür?


5
Önemsiz örnek: X, bir Bernoulli dağılımına sahiptir (yani, 0 veya 1 değerlerini alarak); Y = X + N (0, 0.1). Ne X ne de Y normalde kendi başına dağılmaz, ancak X üzerinde Y'ye gerileme hala işe yarar.
Hong Ooi

Sanırım değişkenlerin dağılımını değil, artıkların dağılımını düşünüyorsunuz.
tashuhka


Yanıtlar:


16

Bir görüntü ile Hong Oois yorumuna genişleyen. Burada, marjinallerin hiçbirinin normal olarak dağıtılmadığı, ancak artıkların hala bulunduğu bir veri kümesinin görüntüsü, bu nedenle doğrusal regresyon varsayımları hala geçerlidir:

resim açıklamasını buraya girin

Görüntü aşağıdaki R kodu ile oluşturulmuştur:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.