Değişen değişkenlik ve artıklar normallik


12

Oldukça iyi olan doğrusal bir regresyonum var, sanırım (bir üniversite projesi için, bu yüzden gerçekten doğru olmak zorunda değilim).

Mesele şu ki, artıkları tahmin edilen değerlere karşı çizersem, (öğretmenime göre) bir heteroskedastisite ipucu var.

Ancak artıkların QQ-Grafiğini çizersem, normal olarak dağıldıkları açıktır. Üstelik artıklar üzerinde Shapiro testi vardır ait -Değer 0.8 Ben hiç şüphe kalıntılar aslında normalde dağıtılır olduğunu düşünüyorum bu yüzden.p0.8

Soru: Artıklar normal olarak dağıtılırsa öngörülen değerler üzerinde heteroskedastisite nasıl olabilir?


1
@Whubers'ın mükemmel cevabına çok kısa bir ek: Araç paketininncvTest işlevini, heterosensedastisite için resmi bir test yapmak için kullanabilirsiniz. Whuber örneğinde, komut neredeyse sıfır olan ve sabit hata varyansına (elbette beklenen) karşı güçlü kanıtlar sağlayan bir p değeri verir . RncvTest(fit)p
COOLSerdash

Yanıtlar:


16

Bu soruya yaklaşmanın bir yolu soruyu tersine bakmaktır: normal olarak dağıtılan artıklarla nasıl başlayabilir ve bunları heterossedastik olarak nasıl düzenleyebiliriz? Bu bakış açısından cevap açık hale gelir: küçük kalıntıları daha küçük tahmin edilen değerlerle ilişkilendirin.

Açıklamak gerekirse, işte açık bir yapı.

şekil

Soldaki veriler doğrusal uyum (göreceli olarak kırmızı ile) göre açıkça heterossedastiktir. Bu artıklar ile ev sürülür vs sağda tahmin arsa. Ancak - yapı olarak - sıralanmamış artıklar seti , ortadaki histogramlarının gösterdiği gibi normal dağılıma yakındır. (Shapiro-Wilk normallik testindeki p değeri 0.60 olup, aşağıdaki kodu çalıştırdıktan sonra verilen Rkomutla elde edilir shapiro.test(residuals(fit)).)

Gerçek veriler de böyle görünebilir. Ahlaki, heterossedastisitenin artık boyut ve tahminler arasındaki bir ilişkiyi karakterize etmesidir, oysa normallik bize artıkların artık başka bir şeyle nasıl ilişkili olduğu hakkında hiçbir şey söylemez.


İşte Rbu yapının kodu.

set.seed(17)
n <- 256
x <- (1:n)/n                       # The set of x values
e <- rnorm(n, sd=1)                # A set of *normally distributed* values
i <- order(runif(n, max=dnorm(e))) # Put the larger ones towards the end on average
y <- 1 + 5 * x + e[rev(i)]         # Generate some y values plus "error" `e`.
fit <- lm(y ~ x)                   # Regress `y` against `x`.
par(mfrow=c(1,3))                  # Set up the plots ...
plot(x,y, main="Data", cex=0.8)
abline(coef(fit), col="Red")
hist(residuals(fit), main="Residuals")
plot(predict(fit), residuals(fit), cex=0.8, main="Residuals vs. Predicted")

2
Peki, eğer düşük kalıntıları yüksek tahmin edilen değerlerle ilişkilendirirsem, kalıntılar normal olarak dağıtılmış olsa bile heteroseladastisite ortaya çıkabilir? Sanırım anladım, ama gerçekten bu konuda daha fazla düşünmeliyim .. neyse teşekkürler!
Ant

... veya düşük öngörülen değerlere sahip düşük kalıntılar (buradaki örnekte olduğu gibi), hatta daha karmaşık yollarla. Örneğin, artıkların ortalama büyüklüğü tahmin edilen değerle salındığında heterossedastisite vardır. (
Heterossedastisitenin

0

Ağırlıklı en küçük kareler (WLS) regresyonunda, görmek isteyebileceğiniz tahmini kalıntıların rastgele faktörleri normalde dağıtılır, ancak genellikle çok önemli değildir. Tahmini kalıntılar, sayfa 1'in alt kısmında basit bir (bir regresör ve başlangıç ​​noktası) regresyon durumunda ve https://www.researchgate.net/publication adresindeki sayfa 2 ve 7'nin alt yarısında gösterildiği gibi çarpanlarına ayrılabilir. / 263036348_Properties_of_Weighted_Least_Squares_Regression_for_Cutoff_Sampling_in_Establishment_Surveys Her neyse, bu normalliğin nerede ortaya çıkabileceğini göstermeye yardımcı olabilir.


Siteye hoş geldiniz, @JimKnaub. Ara sıra sorulan sorulara ilişkin uzmanlığınızı ödünç vermenizi isteriz. Neden hesabınızı kaydettirmiyorsunuz? Nasıl yapacağınızı yardım merkezimizin Hesabım bölümünde bulabilirsiniz . Burada yeni olduğunuz için, yeni kullanıcılar için bilgi içeren turumuza katılmak isteyebilirsiniz .
dediklerinin - Eski Monica

3
Soru-cevap şeklinde yüksek kaliteli istatistiki bilgilerin kalıcı bir havuzunu oluşturmaya çalışıyoruz. Bu nedenle, linkrot nedeniyle bağlantılara bağlı cevaplara dikkat ediyoruz. Linkten tam bir alıntı ve bilgilerin bir özetini (örn., Şekiller / açıklamalar) yayınlayabilir misiniz, böylece bağlantı kopsa bile bilgiler yararlı olur mu?
gung - Monica'yı
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.