Kalıntıların hetero-esneklik ölçüleri


16

Bu wikipedia bağlantısı OLS kalıntılarının hetero-esnekliğini tespit etmek için bir takım teknikleri listeler. Hetero-esneklikten etkilenen bölgelerin tespitinde hangi uygulamalı tekniğin daha verimli olduğunu öğrenmek istiyorum.

Örneğin, burada OLS 'Residuals vs Fitted' planındaki orta bölgenin, arsanın yanlarından daha yüksek varyansa sahip olduğu görülmüştür (gerçeklerden tam olarak emin değilim, ancak sorunun uğruna olduğunu varsayalım). Onaylamak için, QQ grafiğindeki hata etiketlerine bakarak bunların Residuals grafiğinin merkezindeki hata etiketleriyle eşleştiğini görebiliriz.

Fakat önemli ölçüde daha yüksek varyansa sahip kalıntı bölgesini nasıl ölçebiliriz ?

varyans


2
Ortada daha yüksek varyansın olduğundan emin değilim. Aykırı değerlerin orta bölgede olması bana büyük olasılıkla verilerin çoğunun olduğu gerçeğin bir sonucu olarak görünmektedir. Tabii ki, bu sizin sorunuzu geçersiz kılmaz.
Peter Ellis

1
Qqplot, homojen olmayan varyansları değil, doğrudan dağılımın normalliğini tanımlamayı amaçlamaktadır.
Michael R. Chernick

@PeterEllis Evet, soruda varyansın farklı olduğundan emin olmadığımı belirttim, ancak bu teşhis resmini kullanışlı buldum ve aslında örnekte bir çeşit heterosepdastisite olabilir.
Robert Kubrick

@MichaelChernick qqplot'tan sadece en yüksek hataların artıklar grafiğinin ortasında nasıl yoğunlaştığını göstermek için bahsetmiştim, bu nedenle potansiyel olarak bu alanda daha yüksek sapma olduğunu gösterir.
Robert Kubrick

Yanıtlar:


15

Bu problemin bir keşif hissi var. John Tukey, klasik Keşifsel Veri Analizinde heteroseladastisiteyi araştırmak için birçok prosedürü tanımlamaktadır (Addison-Wesley 1977). Belki de en doğrudan yararlı olanı, " gezici şematik arsa " nın bir çeşididir . Bu, bir değişkeni (tahmin edilen değer gibi) kutulara böler ve her bir bölme için diğer değişkenin yerini, yayılmasını ve şeklini göstermek için m harfli özetleri (kutu grafiklerinin genelleştirilmesi) kullanır. M harfi istatistikleri, şans sapmalarından ziyade genel kalıpları vurgulamak için daha da düzleştirilir.

Hızlı bir versiyon, içindeki boxplotprosedürü kullanarak pişirilebilir R. Simüle edilmiş güçlü heteroscedastik verilerle açıklıyoruz:

set.seed(17)
n <- 500
x <- rgamma(n, shape=6, scale=1/2)
e <- rnorm(length(x), sd=abs(sin(x)))
y <- x + e

Veri

Öngörülen değerleri ve kalıntıları OLS regresyonundan alalım:

fit <- lm(y ~ x)
res <- residuals(fit)
pred <- predict(fit)

Öyleyse burada, tahmin edilen değerler için eşit sayım kutuları kullanan gezici şematik çizimdir. Kullandığım lowesshızlı-and-kirli pürüzsüz için.

n.bins <- 17
bins <- cut(pred, quantile(pred, probs = seq(0, 1, 1/n.bins)))
b <- boxplot(res ~ bins, boxwex=1/2, main="Residuals vs. Predicted",
             xlab="Predicted", ylab="Residual")
colors <- hsv(seq(2/6, 1, 1/6))
temp <- sapply(1:5, function(i) lines(lowess(1:n.bins, b$stats[i,], f=.25), 
        col=colors[i], lwd=2))

Gezici şematik çizim

Mavi eğri medyanları yumuşatır. Yatay eğilimi, regresyonun genellikle iyi bir uyum olduğunu gösterir. Diğer eğriler kutu uçlarını (çeyrekler) ve parmaklıkları (tipik olarak aşırı değerler olan) yumuşatır. Güçlü yakınsamaları ve müteakip ayrımları, hetero-esnekliğe tanıklık eder ve onu karakterize etmemize ve ölçmemize yardımcı olur.

(Öngörülen değerlerin dağılımını yansıtan yatay eksen üzerindeki doğrusal olmayan ölçeğe dikkat edin. Biraz daha fazla çalışma ile bu eksen doğrusallaştırılabilir, bu bazen yararlıdır.)


6
Güzel bir örnek, çalışan miktarların bazı uygulamalarının R'de mevcut olduğunu düşünürdüm (kutulardaki sorunu tamamen önlemek için). Bana çanta çizimlerini hatırlatıyor . Ayrıca Rainbow paketinde Rob Hyndman'ın uzantısına bakın .
Andy W

9

Tipik olarak, heteroskedastisite bir Breusch-Pagan yaklaşımı kullanılarak modellenmiştir. Daha sonra lineer regresyonunuzdaki artıklar karelenir ve orijinal lineer modelinizdeki değişkenlere regrese edilir. Son regresyona yardımcı regresyon denir .

nR,bir2nR,bir2R,2

Amacınız için, hangi değişkenlerin yüksek veya düşük varyans sonuçlarını en yordadığını görmek için bu modelden ayrı katsayılara odaklanabilirsiniz.


1
+1 Ancak, bu tür testlerin tespit edebilecekleri hetero-esneklik biçimleriyle sınırlı olduğunu lütfen unutmayın. Cevaplarımda gösterilene benzer örnekler, heterosensedastisite son derece güçlü olmasına rağmen, tam olarak kayabilir.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.