Artık standart hata nedir?


35

R'de bir çoklu regresyon modeli çalıştırırken, çıkışlardan biri 95,161 serbestlik derecesinde 0.0589'luk bir artık standart hatadır. 95.161 serbestlik derecesinin, örneklemimdeki gözlem sayısı ile modelimdeki değişken sayısı arasındaki farktan kaynaklandığını biliyorum. Artık standart hata nedir?


2
Bu soru ve cevapları yardımcı olabilir: Neden artık standart hata söylüyoruz?
Antoine Vernet,

Hızlı bir soru: "Artık standart hata", "artık standart sapma" ile aynı mıdır? Gelman ve Hill (s.41, 2007) onları birbirlerinin yerine kullanıyor gibi görünmektedir.
JetLag

Yanıtlar:


26

Takılan regresyon modeli, çalışmayı aynı değerleriyle sonsuz sayıda (ve doğrusal modelin gerçek olduğu zaman) tekrarlarsanız, gözlemlenen yanıtların aracı olan nokta tahmin tahminlerini üretmek için parametreleri kullanır . Bu öngörülen değerler ile modele uyması için kullanılanlar arasındaki farka, veri toplama işlemini kopyalarken, 0 yolu ile rastgele değişkenlerin özelliklerine sahip olan "artıklar" denir.X

Gözlenen artıklar daha sonra bu değerlerdeki değişkenliği tahmin etmek ve parametrelerin örnekleme dağılımını tahmin etmek için kullanılır. Kalan standart hata tam olarak 0 olduğunda, model verilere mükemmel şekilde uyar (büyük olasılıkla fazla takma nedeniyle). Kalan standart hatanın koşulsuz yanıttaki değişkenlikten önemli ölçüde farklı olduğu gösterilemiyorsa, doğrusal modelin herhangi bir tahminde bulunabileceğini gösteren çok az kanıt vardır.


3
Bu daha önce cevaplanmış olabilir. Bakalım bu soru ihtiyacın olan cevapları sağlıyor mu? [R'nin lm () çıktısının yorumlanması] [1] [1]: stats.stackexchange.com/questions/5135/…
doug.numbers

26

Diyelim ki aşağıdaki ANOVA tablosuna sahibiz (R'nin example(aov)komutundan uyarlanmıştır ):

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

Eğer kareler toplamını herhangi bir varyasyon kaynağından (model veya artıklar) kendi serbestlik derecelerine göre bölerseniz, ortalama kareyi elde edersiniz. Özellikle artıklar için:

306.34=76.57576.57

Yani, 76.57 artıkların ortalama karesidir, yani, cevap değişkeninizdeki artık (model uygulandıktan sonra) değişimin miktarıdır.

Rezidüel standart hata hakkında sordunuz başka bir şey değildir ortalama kare hatası pozitif kare kökü . , artık standart hata veya yaklaşık eşit olacaktır . R bu bilgiyi "4 serbestlik derecesinde 8.75" olarak verir.76.57


1
@AdamO'nun cevabını arttırdım çünkü doğrudan en sık regresyon kullanan bir kişi olarak bu cevap benim için en kolay olanıydı. Bununla birlikte, ANOVA ve doğrusal regresyon arasındaki noter / kavramsal / metodolojik ilişkiyi gösterdiği için bu cevabı takdir ediyorum.
svannoy

12

Genellikle şöyle bir regresyon modeline sahip olacaksınız: burada , bağımsız bir hata terimidir .

Y=β0+β1X+ϵ
ϵX

Eğer ve bilinmektedir, hala mükemmel nedeniyle X kullanarak Y tahmin edemez . Bu nedenle, RSE'yi Standart Sapma değerinin bir yargı değeri olarak kullanıyoruz .β0β1ϵϵ

RSE, "İstatistiksel Öğrenmeye Giriş" bölümünde açıkça açıkça açıklanmaktadır.


2
ϵRSE=RSS(n2)

1
ISL epubini okuyan herkes için ctrl-f "rezidüel standart hata" ile "sayfa 66" yi bulabilirsiniz. (Epub dosyalarının gerçek sayfa numaraları yoktur).
user2426679
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.