Lm modelinde öğrenci kalıntıları v / s standart kalıntıları mıdır?


10

"Öğrenci kalıntıları" ve "standart kalıntılar" regresyon modellerinde aynı mıdır? R'de doğrusal bir regresyon modeli oluşturdum ve Studentized artıklarının v / s uygun değerlerinin grafiğini çizmek istedim, ancak R'de bunu yapmanın otomatik bir yolunu bulamadım.

Bir modelim olduğunu varsayalım

library(MASS)

lm.fit <- lm(Boston$medv~(Boston$lstat))

daha sonra kullanma plot(lm.fit), Öğrenci Değerli artıkların karşılık gelen değerlere ilişkin bir grafiğini sağlamaz ancak yine de Standartlaştırılmış kalıntıların yerine geçen değerlerin grafiğini sağlar.

Kullandım plot(lm.fit$fitted.values,studres(lm.fit)ve istenen grafiği çizeceğim.Bu yüzden doğru yoldan gittiğimi ve Studentized ve Standardized artıklarının aynı şey olmadığını doğrulamak istiyorum. Farklıysa, lütfen bunları ve tanımlarını hesaplamak için bir rehber sağlayın. İnternette arama yaptım ve biraz kafa karıştırıcı buldum.


2
O 1 olan (a) 'aslında artıkların bu tür farklı olduğundan kafa karıştırıcı ama (b) Farklı yetkililer onları aramak için ne katılmıyorum! Örneğin, Rterminoloji Montgomery, Peck ve Vining'in (35 yıldır popüler bir regresyon ders kitabı) tam tersidir. Bu yüzden dikkatli olun Rve terminolojinin ne anlama geldiğine güvenmek yerine belgeleri ve gerekirse kaynak kodunu incelediğinizden emin olun .
whuber

Yanıtlar:


11

Hayır, öğrenci kalıntıları ve standart kalıntılar farklı (ancak ilgili) kavramlardır.

R aslında yerleşik işlevler sağlar rstandard()ve etkinin birrstudent() parçası olarak. Önlemler . Aynı yerleşik paket, kaldıraç, Cook'un mesafesi vb.Için birçok benzer işlev sağlar rstudent(), aslında MASS::studres()kendiniz için bu şekilde kontrol edebilirsiniz:

> all.equal(MASS::studres(model), rstudent(model))
[1] TRUE

Standartlaştırılmış kalıntılar , noktanın kaldıraç / etkisini dikkate alan belirli bir veri noktası için hatayı tahmin etmenin bir yoludur. Bunlara bazen "dahili olarak öğrenci kalıntıları" denir.

ri=eis(ei)=eiMSE(1hii)

Standart artıkların arkasındaki motivasyon, modelimiz sabit varyanslı bir iid hata terimi ile homoscedasticity varsaymış olsa da ϵiN(0,σ2), dağıtım, artıklar ei olamaz artıkların toplamı her zaman olduğundan istatistiksel bağımsız olması tam sıfır.

Herhangi bir veri noktası için öğrenci kalıntıları , söz konusu veri noktası dışındaki diğer tüm veri noktalarına uyan bir modelden hesaplanır . Bunlara çeşitli şekilde "dışarıdan öğrenilen artıklar", "silinmiş artıklar" veya "çakılaştırılmış artıklar" denir.

Hesaplama zor (o bu sesleri geliyor biz her noktası için bir yeni model sığdırmak zorundayız gibi) ama aslında çivisiz olmadan sadece orijinal modelden bunu hesaplamak için bir yol var. Standart kalıntı artık iseri, sonra kalan öğrenci ti dır-dir:

ti=ri(nk2nk1ri2)1/2,

Öğrencilerin kalanlarının ardındaki motivasyon, aykırı testlerde kullanımlarından kaynaklanmaktadır. Bir noktanın bir aykırı değer olduğundan şüphelenirsek, tanım gereği varsayılan modelden üretilmemiştir. Bu nedenle, bu aykırı değeri modelin uyumuna dahil etmek bir hata - varsayımların ihlali - olacaktır. Öğrenci kalıntıları pratik aykırı değer tespitinde yaygın olarak kullanılmaktadır.

Studentized kalıntılar aynı zamanda her bir veri noktası için, arzu özelliğine sahip dağıtım orijinal regresyon modelinin normallik varsayımlarının kalıntı olacak Student t-dağılımının, karşılandı. (Standartlaştırılmış artıkların dağılımı o kadar da güzel değil.)

Son olarak, R kütüphanesinin yukarıda belirtilenden farklı bir adlandırma izlemiş olabileceği endişelerini gidermek için, R belgeleri açıkça "standartlaştırılmış" ve "öğrencileştirilmiş" ifadelerini yukarıda açıklananla aynı anlamda kullandıklarını açıkça belirtmektedir.

Fonksiyonlar rstandardve rstudentsırasıyla standartlaştırılmış ve öğrenci haline getirilmiş artıklar verir. (Bunlar, sırasıyla hata varyansının genel ve bir kerelik dışında bırakma ölçüsünü kullanarak, artıkları birim varyansına sahip olacak şekilde yeniden normalleştirir .)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.