Regresyon katsayılarının tahminleri birbiriyle ilişkili değil mi?


11

Basit bir gerilemeyi düşünün (normalite kabul edilmez):

Yben=bir+bXben+eben,
nerede eben kaba 0 ve standart sapma σ. En Küçük Kare Tahminleribir ve b ilintisiz?

2
Ne düşünüyorsun? en.wikipedia.org/wiki/Ordinary_least_squares , bölüm "Sonlu örnek özellikler". Bu soru bu sitede birçok kez cevaplanmıştır.
mpiktas

Yanıtlar:


15

Bu, tahminler arasında hiçbir ilişkinin (veya çok az) korelasyonunun bulunmasının istenebileceği deneylerin tasarlanmasında önemli bir husustur. a^ ve b^. Böyle bir korelasyon eksikliği,Xi.


Etkilerini analiz etmek Xi tahminlerde, değerler (1,Xi) (bunlar uzunluktaki satır vektörleridir 2) bir matrise dikey olarak monte edilir X, tasarım matrisi, veri sayısı kadar satır ve (açıkça) iki sütun içerir. Karşılık gelenYi bir uzun (sütun) vektörüne birleştirilir y. Bu anlamda yazmaβ=(a,b) toplanan katsayılar için model

E(Y)=Xβ

Yi (genellikle) varyansları sabit olan bağımsız rasgele değişkenler olduğu varsayılır σ2 bilinmeyenler için σ>0. Bağımlı gözlemlery vektör değerli rastgele değişkenin bir gerçekleştirilmesi olarak kabul edilir. Y.

OLS çözümü

β^=(XX)1Xy,

bu matrisin ters olduğu varsayılarak. Böylece, matris çarpımı ve kovaryansın temel özelliklerini kullanarak,

Cov(β^)=Cov((XX)1XY)=((XX)1Xσ2X(XX)1)=σ2(XX)1.

Matris (XX)1 model parametrelerine karşılık gelen yalnızca iki satır ve iki sütuna sahiptir (a,b). Korelasyonua^ ile b^ , diyagonal olmayan elemanlarıyla orantılıdır. (XX)1,ki Cramer Kuralı , iki sütununun nokta çarpımı ile orantılıdır.X. Sütunlardan biri tamamen1s, diğer sütunlu nokta çarpımı ( Xi) toplamlarıdır,

a^ ve b^ yalnızca toplam (veya ortalama olarak ortalama) Xi sıfırdır.

Sıkça sağlanır Bu ortagonalite durum recenteringXi(ortalamalarını her birinden çıkararak). Bu, tahmini eğimi değiştirmeyecek olsa dab^, tahmini kesmeyi değiştirir a^. Bunun önemli olup olmadığı uygulamaya bağlıdır.


Bu analiz çoklu regresyon için geçerlidir: tasarım matrisi p+1 için sütunlar p bağımsız değişkenler (ek bir sütun 1s) ve β uzunluk vektörü olacak p+1, ama aksi takdirde her şey eskisi gibi olur.

Geleneksel dilde, iki sütun Xnokta çarpımları sıfır olduğunda dik olarak adlandırılır . Ne zaman bir sütunX (sütun söyle i) diğer tüm sütunlara diktir, sıradaki tüm köşegen olmayan girişlerin kolayca gösterilebilen cebirsel bir gerçektir i ve sütun i nın-nin (XX)1 sıfır (yani, ij ve ji herkes için bileşenler jisıfır). Sonuç olarak,

İki çoklu regresyon katsayısı tahmini β^i ve β^j tasarım matrisinin karşılık gelen sütunlarından herhangi biri (veya her ikisi) diğer tüm sütunlarla dikey olduğunda ilişkisizdir.

Birçok standart deneysel tasarım, sütunları karşılıklı dik yapmak için bağımsız değişkenlerin değerlerinin seçilmesinden oluşur. Bu, ortaya çıkan tahminleri - herhangi bir veri toplanmadan önce! - tahminlerin ilişkisiz olacağını garanti ederek "ayırır". (Yanıtlar Normal dağılımlara sahip olduğunda bu, tahminlerin bağımsız olacağı anlamına gelir ve bu da yorumlarını büyük ölçüde basitleştirir.)


Bu sorunun cevabı "[...] X'in iki kolonunun sadece nokta ürünleri olan diyagonal olmayan elemanlar" diyor. Bu doğrudurXX, değil (XX)1ancak?
Heisenberg

@Heisenberg Bu iyi bir nokta. Bu konuda net değildim. İki sütun söz konusu olduğunda belirsizlik yoktur, ancak daha fazla sütun söz konusu olduğunda sunumun nasıl geliştirileceğini düşünmem gerekir.
whuber

@Heisenberg Algılayıcı gözleminiz için minnettarım: çoklu regresyon vakasının tartışılmasında önemli bir hatayı düzeltmemi sağladı.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.