Doğrusal bir regresyon modelinde “sabit varyansa” sahip olmanın anlamı nedir?


53

Hata teriminde "sabit varyans" olması ne anlama geliyor? Gördüğüm gibi, bir bağımlı değişken ve bir bağımsız değişken içeren bir verimiz var. Sabit varyans, doğrusal regresyon varsayımlarından biridir. Eşcinselliğin ne anlama geldiğini merak ediyorum. 500 satırım olsa bile, açıkça sabit olan tek bir varyans değerim olacaktı. Varyansı hangi değişkenle karşılaştırmalıyım?

Yanıtlar:


34

Bu, bireysel hatayı tahmin edilen değere göre çizdiğinizde, hatanın tahmin edilen değerinin varyansının sabit olması gerektiği anlamına gelir. Aşağıdaki resimde kırmızı oklara bakın, kırmızı çizgilerin uzunluğu (varyansının bir vekili) aynıdır.

görüntü tanımını buraya girin


1
Tamam anlaşıldı.!! Ancak bu bir varsayım olduğundan modeli çalıştırmadan önce varsayımı doğrulamamız gerekmez. Ve neden bu varsayıma ihtiyacımız var
Mukul

2
Bazı varsayımlar ancak model çalıştırıldıktan sonra test edilebilir. Bir modelin hesaplanması sadece matematiktir ve bir modelin yorumlanmasıyla aynı değildir.
John

6
Menzil değişmez Penguin Knight bu yüzden burada ifadelerinizi güncellemek isteyebilirsiniz.
John

4
Varyans varsayımınız yanlışsa, bu genellikle standart hataların yanlış olduğu ve herhangi bir hipotez testinin yanlış sonuçlara yol açabileceği anlamına gelir. (Farklı bir John)
John

4
Ben biraz farklıyım. Heterosistemlerin kesinliğinin zorunlu olarak, betalarınızın standart hatalarının yanlış olduğu anlamına gelmez, bunun yerine OLS tahmincisinin artık en verimli tarafsız tahmin edici olmadığı anlamına gelmez. Diğer bir deyişle, ya sabit bir farkınız varsa (belki de Y'nin dönüşümü nedeniyle) ya da tutarlılığı tam olarak hesaba katarsanız (belki de genelleştirilmiş en küçük kareler tahmincisi aracılığıyla), daha fazla güç / hassasiyet elde edebilirsiniz.
gung - Monica

58


Y=β0+β1X+εwhere εN(0,σε2)
β0+β1Xσε2

σε2XYεβ0, β1, σε2)Xσε2

Y=β0+β1X+εwhere εN(0,f(X)) where f(X)=exp(γ0+γ1X)and γ10
Xf(X) X

X. Ancak, arazilere bakmanın en iyisi olduğunu düşünüyorum. @Penquin_Knight, homoscedastizmin takılan değerlere karşı elde ettiği bir modelin kalıntılarını çizerek, sabit değişimin neye benzediğini gösterme konusunda iyi bir iş çıkarmıştır. Heterosansdastisite, muhtemelen ham verilerin bir alanında veya ölçek konumunun (aynı zamanda yayılma seviyesi olarak da bilinir) arsada tespit edilebilir. R uygun bir çağrı ile sizin için uygun olanı çizer plot.lm(model, which=2); bir ile bu donatılmış değerlerine karşı artanların mutlak değerlerini kareköküdür lowess eğrisi yardımseverlikle kaplanmıştır. Lowess uyumunun eğimli değil düz olmasını istiyorsunuz.

Homossedastik ve heterossedastik verilerin bu üç farklı şekil tipinde nasıl görünebileceğini karşılaştıran aşağıdaki grafikleri dikkate alın. Üst iki heteroscedastik parselin huni şeklini ve sonuncunun yukarı doğru eğimli alçak çizgisini not edin.

görüntü tanımını buraya girin

Bütünlüğü için, bu verileri üretmek için kullandığım kod:

set.seed(5)

N  = 500
b0 = 3
b1 = 0.4

s2 = 5
g1 = 1.5
g2 = 0.015

x        = runif(N, min=0, max=100)
y_homo   = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2            ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))

mod.homo   = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)

1
teşekkürler çok yardımcı oldu. Ayrıca bu varsayıma neden bir meslekten olmayan dilde ihtiyaç duyduğumuzu açıklayabilir misiniz
Mukul

5
Birşey değil, @Mulul. OLS tahmincisinin (yani, varsayılan prosedür yazılımının betaları tahmin etmek için kullandığı) OLS tahmincisinin (örneğin, beta'ları tahmin etmek için kullandığı) varsayımını yapmak için homoscedastisite varsayımı (sabit varyans) varsayımı gereklidir. gerçek değere dayanan örnekleme dağılımları. IE, OLS tahmincisinin minimum varyans yansız tahmincisi olması gerekir .
dediklerinin - Monica Yeniden

5
p(p(1p))/n)

2
Yorumunuzda, tüm sözcükleri minimum değişkenlik yansız kestiricisi ifadesinde italik ifadeler koyuyorsunuz. Heterosidalite ile tahmin edicinin daha az verimli olacağını (daha fazla değişkenlik) anlayacağımı, ancak bunun da önyargılı hale geleceğini anlıyorum.
user1205901 - Monica'yı

5
@ user1205901, tarafsız kalıyor.
gung - Monica'yı yeniden
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.