Doğrusal regresyonda katsayıların varyans-kovaryans matrisi nasıl elde edilir


36

Doğrusal regresyon hakkında bir kitap okuyorum ve nin varyans-kovaryans matrisini anlamada bazı problemlerim var :b

görüntü tanımını buraya girin

Köşegen öğeler yeterince kolaydır, ancak köşegen olmayan öğeler biraz daha zordur, beni şey şu:

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

ancak burada ve yok.β 1β0β1



2
Kitap hangisi
Konstantinos

Yanıtlar:


53

Bu aslında sizin bir regresyon konusundaki temel anlayışınızı zorlayan harika bir soru.

İlk olarak, gösterim ile ilgili herhangi bir ilk karışıklığı çıkarın. Regresyona bakıyoruz:

y=b0+b1x+u^

nerede ve true tahmincisi ve ve regresyon kalıntılar bulunmaktadır. Altta yatan doğru ve engellenmemiş regresyonun şöyle belirtildiğine dikkat edin:b0b1β0β1uu^

y=β0+β1x+u

ve varyans beklentisi ile . Bazı kitaplar göstermek olarak ve burada bu sözleşmeye uyum. Ayrıca, b'nin tahmin edicilerini tutan 2x1 vektör olduğu , yani matris notasyonunu da kullanırız . (Ayrıca netlik sağlamak için X'i aşağıdaki hesaplamalarda belirtildiği gibi kabul ediyorum.)E[u]=0E[u2]=σ2bβ^β=[β0,β1]b=[b0,b1]

Şimdi sorunuza. Kovaryans formülünüz gerçekten doğrudur, yani:

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

Sanırım bu formülde gözlemlenmeyen gerçek katsayıların nasıl geldiğini bilmek ister misiniz ? Formülü genişleterek bir adım daha ileri gidersek, aslında iptal edilirler. Bunu görmek için, tahmin edicinin popülasyon varyansının şu şekilde verildiğine dikkat edin:β0,β1

Var(β^)=σ2(XX)1

Bu matris, köşegen elemanlardaki değişimleri ve köşegen dışı elemanlardaki kovaryansları tutar.

Yukarıdaki formüle ulaşmak için, talebinizi matris notasyonu kullanarak genelleştirelim. Bu nedenle ile varyansı ve ile beklentiyi gösterelim .Var[]E[]

Var[b]=E[b2]E[b]E[b]

Temelde, sadece matris notasyonu kullanarak genel varyans formülüne sahibiz. Denklem, tahmincisinin standart ifadesinde yer değiştirdiğinde . Ayrıca, yansız bir tahmin edici olduğunu varsayalım . Dolayısıyla, biz elde ediyoruz:b=(XX)1XyE[b]=β

E[((XX)1Xy)2]β22×2

Sağ tarafta - 2x2 matrisi, yani , ancak bu noktada kısa sürede bu terimle ne olacağını tahmin edebilirsiniz.β2bb

Yukarıdaki gerçek veri oluşturma işlemi için ifademizi ile değiştirerek aşağıdakileri yaptık:y

E[((XX)1Xy)2]β2=E[((XX)1X(Xβ+u))2]β2=E[((XX)1XX=Iβ+(XX)1Xu)2]β2=E[(β+(XX)1Xu)2]β2=β2+E[(XX)1Xu)2]β2

beri . Ayrıca, ikinci dereceden terimi beklendiği şekilde iptal edilir.E[u]=0β2

Böylece biz var:

Var[b]=((XX)1X)2E[u2]

Beklentilerin doğrusallığı ile. Varsayımına göre ve çünkü , bir simetrik matrisidir ve dolayısıyla transpozisyonuyla aynıdır. Sonunda varıyoruzE[u2]=σ2((XX)1X)2=(XX)1XX(XX)1=(XX)1XXK×K

Var[b]=σ2(XX)1

Şimdi tüm terimlerinden kurtulduk . Sezgisel olarak, tahmin edicinin varyansı, gerçek temel katsayı değerinden bağımsızdır, çünkü bu kendi başına rastgele bir değişken değildir. İle de çapraz elemanların kapalı ve böylece de geçerlidir kitapta gösterildiği gibi sonuç varyans kovaryans matrisi içinde tek tek tüm elemanları için de geçerlidir sırasıyla iptal etmek. Tek sorun, ilk başta bu iptali göstermeyen varyans için genel formülü uygulamanızdı.ββ0β1

Sonuç olarak, katsayı varyans azaltır ve bağımsız . Ama bu ne anlama geliyor? (Genel kovaryans matrisi hakkında daha genel bir bilgi edinmek istediğinizi düşünüyorum.)σ2(XX)1β

Kitaptaki formüle bakın. Basitçe tahmin edicinin varyansının, temel hata teriminin daha gürültülü olduğu durumlarda ( arttığında) arttığını, ancak X yayılımının arttığında azaldığını iddia eder . Çünkü gerçek değerin etrafına daha fazla gözlem yayılması, genel olarak daha doğru ve dolayısıyla gerçek değerine yakın bir tahminci oluşturmanıza olanak sağlar . Öte yandan, diyagonal dışı kovaryans terimleri, gibi eklem hipotezlerinin hipotez testlerinde pratik olarak . Bunun dışında onlar gerçekten biraz şekerleme. Umarım bu tüm soruları netleştirir.σ2βb0=b1=0


ve formanın sabit kalması ve x'in azalması durumunda, kesişmenin standart hatası daha küçük hale gelir, bu da mantıklı olur.
Theta30

Meydanın genişlemesini takip etmiyorum. Neden basitleştirilmemiş ? ((XX)1X)2=((XX)1X)((XX)1X)=X2
David

2

Senin durumunda biz var

XX=[nXiXiXi2]

Bu matrisi ters çevirin ve istediğiniz sonucu elde edin.


1

Görünüşe göre öngörülen değerler (beklenen değerler). ve arasında geçiş . E ( b 0 ) = β 0 E ( b 1 ) = β 1β0β1E(b0)=β0E(b1)=β1


β 1β0 ve genellikle bilinmiyor, neye geçebilirler? β1
13’de

Ben karışıklığı anlamaya düşünüyorum ve onlar belki yazdım gerektiğini düşünüyorum ziyade . İşte hesaplamalardan geçen bir başka yazı: link β 0β0β0
Drew75

2
@qed: bilinmeyen miktarların tahminlerini örneklemek için.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.