@NickCox, iki grubunuz olduğunda artıkların ekranları hakkında iyi bir iş çıkardı. Bu konunun arkasında yatan bazı açık soruları ve örtülü varsayımları ele alalım.
Soru, "bağımsız bir değişken ikili olduğunda homoscedasticity gibi doğrusal regresyon varsayımlarını nasıl test ediyorsunuz?" Bir var çoklu regresyon modeli. Bir (çoklu) regresyon modeli, her yerde sabit olan yalnızca bir hata terimi olduğunu varsayar. Her bir yordayıcı için ayrı ayrı heteroscedastisite olup olmadığını kontrol etmek çok anlamlı değildir (ve sizde yoktur). Bu nedenle, çoklu regresyon modelimiz olduğunda, artıkların parsellerinden tahmin edilen değerlere karşı heterossedastisite tanısı koyarız. Muhtemelen bu amaçla en yararlı arsa bir olan ölçek konum tahmin edilen değerler vs artıkların mutlak değerinin karesinin bir komplodur (ayrıca 'yayılma düzeyi' denir) arsa. Örnekleri görmek için,Doğrusal regresyon modelinde "sabit varyans" olması ne anlama gelir?
Benzer şekilde, her bir öngörücünün kalıntılarını normallik açısından kontrol etmek zorunda değilsiniz. (Dürüst olmak gerekirse bunun nasıl çalışacağını bile bilmiyorum.)
Ne yapabilirsiniz bireysel belirleyicileri karşı artıkların araziler ile ilgisi fonksiyonel Form düzgün belirtilen olup olmadığını görmek için bir kontroldür. Örneğin, artıklar bir parabol oluşturuyorsa, verilerde kaçırdığınız bazı eğrilikler vardır. Bir örnek görmek için, @ Glen_b'nin cevabındaki ikinci konuya bakın: Doğrusal regresyonda model kalitesini kontrol etme . Ancak, bu sorunlar ikili bir yordayıcı için geçerli değildir.
Değeri ne olursa olsun, sadece kategorik öngörücüleriniz varsa, hetero-esnekliği test edebilirsiniz. Sadece Levene testini kullanıyorsun. Burada tartışıyorum: Levene'in neden F oranı yerine varyans eşitliği testi? R'de , araba paketinden ? LeveneTest kullanırsınız .
Düzenleme: Daha iyi bir çoklu regresyon modeli olduğunda kalıntıları bir tekil tahmin değişkeni vs bir arsa bakarak yardımcı olmadığını göstermek için, bu örneği düşünün:
set.seed(8603) # this makes the example exactly reproducible
x1 = sort(runif(48, min=0, max=50)) # here is the (continuous) x1 variable
x2 = rep(c(1,0,0,1), each=12) # here is the (dichotomous) x2 variable
y = 5 + 1*x1 + 2*x2 + rnorm(48) # the true data generating process, there is
# no heteroscedasticity
mod = lm(y~x1+x2) # this fits the model
Veri üretme işleminden herhangi bir hetero-esneklik olmadığını görebilirsiniz. Modelin ilgili çizimlerini, sorunlu bir heterosensedastisite ima edip etmediklerini görmek için inceleyelim:
Hayır, endişelenecek bir şey yok. Bununla birlikte, orada heteroseladastisite olup olmadığını görmek için artıkların ikili ikili tahmin değişkenine karşı grafiğine bakalım:
Ah, bir sorun olabilir gibi görünüyor. Veri üretme sürecinden herhangi bir hetero-esneklik olmadığını biliyoruz ve bunu araştırmak için birincil grafikler de hiç göstermedi, bu yüzden burada neler oluyor? Belki bu parseller yardımcı olacaktır:
x1
ve x2
birbirinden bağımsız değillerdir. Üstelik gözlemler x2 = 1
uç noktalarda. Daha fazla kaldıraçları vardır, bu nedenle kalıntıları doğal olarak daha küçüktür. Bununla birlikte, herhangi bir hetero-esneklik yoktur.
Eve götür mesajı: En iyi seçeneğiniz, sadece uygun grafiklerden (artıklara karşı yerleştirilmiş grafik ve spread seviyesi grafiği) heteroscedastisiteyi teşhis etmektir.