Doğrusal regresyon hakkında bir kitap okuyorum ve nin varyans-kovaryans matrisini anlamada bazı problemlerim var :
Köşegen öğeler yeterince kolaydır, ancak köşegen olmayan öğeler biraz daha zordur, beni şey şu:
ancak burada ve yok.β 1
Doğrusal regresyon hakkında bir kitap okuyorum ve nin varyans-kovaryans matrisini anlamada bazı problemlerim var :
Köşegen öğeler yeterince kolaydır, ancak köşegen olmayan öğeler biraz daha zordur, beni şey şu:
ancak burada ve yok.β 1
Yanıtlar:
Bu aslında sizin bir regresyon konusundaki temel anlayışınızı zorlayan harika bir soru.
İlk olarak, gösterim ile ilgili herhangi bir ilk karışıklığı çıkarın. Regresyona bakıyoruz:
nerede ve true tahmincisi ve ve regresyon kalıntılar bulunmaktadır. Altta yatan doğru ve engellenmemiş regresyonun şöyle belirtildiğine dikkat edin:u
ve varyans beklentisi ile . Bazı kitaplar göstermek olarak ve burada bu sözleşmeye uyum. Ayrıca, b'nin tahmin edicilerini tutan 2x1 vektör olduğu , yani matris notasyonunu da kullanırız . (Ayrıca netlik sağlamak için X'i aşağıdaki hesaplamalarda belirtildiği gibi kabul ediyorum.)
Şimdi sorunuza. Kovaryans formülünüz gerçekten doğrudur, yani:
Sanırım bu formülde gözlemlenmeyen gerçek katsayıların nasıl geldiğini bilmek ister misiniz ? Formülü genişleterek bir adım daha ileri gidersek, aslında iptal edilirler. Bunu görmek için, tahmin edicinin popülasyon varyansının şu şekilde verildiğine dikkat edin:
Bu matris, köşegen elemanlardaki değişimleri ve köşegen dışı elemanlardaki kovaryansları tutar.
Yukarıdaki formüle ulaşmak için, talebinizi matris notasyonu kullanarak genelleştirelim. Bu nedenle ile varyansı ve ile beklentiyi gösterelim .
Temelde, sadece matris notasyonu kullanarak genel varyans formülüne sahibiz. Denklem, tahmincisinin standart ifadesinde yer değiştirdiğinde . Ayrıca, yansız bir tahmin edici olduğunu varsayalım . Dolayısıyla, biz elde ediyoruz:
Sağ tarafta - 2x2 matrisi, yani , ancak bu noktada kısa sürede bu terimle ne olacağını tahmin edebilirsiniz.
Yukarıdaki gerçek veri oluşturma işlemi için ifademizi ile değiştirerek aşağıdakileri yaptık:
beri . Ayrıca, ikinci dereceden terimi beklendiği şekilde iptal edilir.
Böylece biz var:
Beklentilerin doğrusallığı ile. Varsayımına göre ve çünkü , bir simetrik matrisidir ve dolayısıyla transpozisyonuyla aynıdır. Sonunda varıyoruz
Şimdi tüm terimlerinden kurtulduk . Sezgisel olarak, tahmin edicinin varyansı, gerçek temel katsayı değerinden bağımsızdır, çünkü bu kendi başına rastgele bir değişken değildir. İle de çapraz elemanların kapalı ve böylece de geçerlidir kitapta gösterildiği gibi sonuç varyans kovaryans matrisi içinde tek tek tüm elemanları için de geçerlidir sırasıyla iptal etmek. Tek sorun, ilk başta bu iptali göstermeyen varyans için genel formülü uygulamanızdı.
Sonuç olarak, katsayı varyans azaltır ve bağımsız . Ama bu ne anlama geliyor? (Genel kovaryans matrisi hakkında daha genel bir bilgi edinmek istediğinizi düşünüyorum.)
Kitaptaki formüle bakın. Basitçe tahmin edicinin varyansının, temel hata teriminin daha gürültülü olduğu durumlarda ( arttığında) arttığını, ancak X yayılımının arttığında azaldığını iddia eder . Çünkü gerçek değerin etrafına daha fazla gözlem yayılması, genel olarak daha doğru ve dolayısıyla gerçek değerine yakın bir tahminci oluşturmanıza olanak sağlar . Öte yandan, diyagonal dışı kovaryans terimleri, gibi eklem hipotezlerinin hipotez testlerinde pratik olarak . Bunun dışında onlar gerçekten biraz şekerleme. Umarım bu tüm soruları netleştirir.