Çoklu regresyon katsayıları için standart hatalar?


18

Bunun çok temel bir soru olduğunun farkındayım, ama hiçbir yerde bir cevap bulamıyorum.

Normal denklemleri veya QR ayrışmasını kullanarak regresyon katsayılarını hesaplıyorum. Her katsayı için standart hataları nasıl hesaplayabilirim? Genellikle standart hatalar olarak hesaplanmaktadır düşünüyorum:

SEx¯ =σx¯n

Ne Her bir katsayı için? Bunu OLS bağlamında hesaplamanın en etkili yolu nedir?σx¯

Yanıtlar:


19

En küçük kareler kestirimi yaparken (normal rasgele bir bileşen varsayarak) regresyon parametre tahminleri normalde gerçek regresyon parametresine ve kovaryans matrisine eşit ortalama ile dağıtılır burada artık varyans ve tasarım matrisidir. ve devrik olan ve modeli denklem ile tanımlanmaktadır Y = X \ p + \ epsilon ile \ beta regresyon parametreleri ve \ epsilon hata terimidir. Bir beta parametresinin tahmini standart sapması, (X ^ TX) ^ {- 1} içindeki ilgili terim alınarak elde edilir. s 2 X T X X T X X Y = X β + ϵ β ϵ ( X T X ) - 1Σ=s2(XTX)-1s2XTXXTXXY=Xβ+εβε(XTX)-1artık varyansın örnek tahmini ile çarpılması ve ardından kare kökün alınması. Bu çok basit bir hesaplama değildir, ancak herhangi bir yazılım paketi sizin için hesaplar ve çıktıda sağlar.

Misal

Draper ve Smith'in 134. sayfasında ( yorumumda atıfta bulunulur), Y = \ beta_0 + \ beta_1 X + \ varepsilon modeline en az kareyle sığdırmak için aşağıdaki verileri sağlarlar, Y=β0+β1X+εburada ε~N-(0,benσ2) .

                      X                      Y                    XY
                      0                     -2                     0
                      2                      0                     0
                      2                      2                     4
                      5                      1                     5
                      5                      3                    15
                      9                      1                     9
                      9                      0                     0
                      9                      0                     0
                      9                      1                     9
                     10                     -1                   -10
                    ---                     --                   ---
Sum                  60                      5                    32
Sum of  Squares     482                     21                   528

Eğimin 0'a yakın olması gereken bir örnek gibi görünüyor.

Xt=(111111111102255999910).

Yani

XtX=(nΣXbenΣXbenΣXben2)=(106060482)

ve

(XtX)1=(Xi2n(XiX¯)2X¯(XiX¯)2X¯(XiX¯)21(XiX¯)2)=(48210(122)612261221122)=(0.3950.0490.0490.008)

burada .X¯=Xi/n=60/10=6

Tahmin için Sxy / S = b1 = (B0) = (Yb-b1 Xb)β=(XTX)1XTY

b1 = 1/61 = 0.0163 ve b0 = 0.5- 0.0163 (6) = 0.402

Kaynaktan Se hata terimi için tahmin edilen standart sapmadır SB1 = Se (0.008) ve SB0 = Se (0.395) üstünde. Se = √2.3085.(XTX)1

Özür dilerim, denklemleri kesip yapıştırdığımda abonelik ve üst simge içermiyordu. Tablo da çoğalmadı çünkü boşluklar yok sayıldı. 3 sayının ilk dizesi, XY ve XY'nin ilk değerlerine karşılık gelir ve üçün followinf dizeleri için aynıdır. Toplamdan sonra sırasıyla XY ve XY toplamları ve ardından sırasıyla XY ve XY için kareler toplamı gelir. 2x2 matrisleri de bozuldu. Köşeli parantezler sonrası değerler soldaki sayıların altında köşeli parantez içinde olmalıdır.


2
Kitabım için bir fiş olarak değil, basit doğrusal regresyonda (Y = aX + b) en küçük kareler çözümünün hesaplamalarından geçiyorum ve a ve b için standart hataları hesaplıyoruz, s.101-103, Biyoistatistik Temelleri Doktorlar, Hemşireler ve Klinisyenler için, Wiley 2011. daha ayrıntılı bir açıklama Draper ve Smith Uygulamalı Regresyon Analizi 3. Baskı, Wiley New York 1998 sayfa 126-127'de bulunabilir. Aşağıdaki cevabımda Draper ve Smith'ten bir örnek alacağım.
Michael R.Chernick

8
Bu siteyle etkileşime girmeye başladığımda Michael, benzer hislerim vardı. Tecrübe ile değişti. Bazı bilmek önemlidir ve bir kez sonra, (neredeyse) İngilizce bir şey yazmak gibi yazmak (neredeyse) kadar hızlıdır. Ayrıca, örnek gönderileri (@chl, cardinal ve post-post başına diğer yüksek itibarlı yanıtlar gibi) inceleyerek referanslar, net çizimler ve iyi düşünülmüş denklemler sağlamanın genellikle çok takdir edildiğini ve iyi olduğunu öğrendim. Alınan. Yüksek kalite, bu siteyi diğerlerinden ayıran bir şeydir. TEX
whuber

2
Hepsi bu kadar Bill ve bu kadar çok insanın bu yüksek kaliteli yazıları vermeye adanmış olması güzel. Latex'i makale yayınlamak gibi başka amaçlarla kullanabilirim. Ama insanların bu sitede benden beklediği tüm çabayı gösterecek zamanım yok. ben sadece bu sitede hizmet vermek için zaman yatırım yapmayacağım.
Michael R.Chernick

4
Ben bağlantı kesme burada olduğunu düşünüyorum: "Bu site hakkında ekstra zaman ve çaba koymak isteyenler gerektiren bir çok şeyden sadece " - @whuber ve ben de, aslında, eğer ekstra zaman almadığını söylüyorlar nasıl yapacağını biliyorsun. Bu sitede yayın yapabilmemiz için öğrenmiyoruz - biz (en azından ben) öğreniyoruz çünkü bir istatistikçi olarak sahip olmak önemli bir beceridir ve bu sitede yayınları daha okunabilir hale getirir. TEXTEX
Makro

3
Buradaki birçok insan gibi, evet, bir istatistikçi olarak çalışıyorum, ama aynı zamanda eğlenceli buluyorum - bu site benim için rekreasyon ve başkalarının gönderilerimin bazılarını yararlı bulması hoş bir bonus. Denklemlerinizi çalışmak için ile işaretliyor ve öğrenmeye değer olduğunu düşünmüyorsanız, öyle olsun, ancak içeriğinizin bir kısmının göz ardı edileceğini bilin. TEX
Makro

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.