Doğrusal regresyonda hataların varyans-kovaryans matrisi


12

Var / cov hata matrisi pratikte istatistiksel analiz paketleri ile nasıl hesaplanır?

Bu fikir benim için teoride açık. Ama pratikte değil. Demek istediğim, rastgele değişkenler vektörünüz varsa , varyans / kovaryans matrisinin olduğunu anlıyorum ortalamadan sapma vektörlerinin dış çarpımı verilecektir: . Σ Σ = E [ ( X - E ( X ) ) ( X - E ( X ) ) ]X=(X1,X2,...,Xn)ΣΣ=E[(X-E(X))(X-E(X))]

Fakat bir örneğim olduğunda, gözlemlerimin hataları rastgele değişkenler değildir. Ya da daha iyisi, ama sadece aynı popülasyondan birkaç özdeş örnek alırsam. Aksi takdirde verilir. Öyleyse, sorum şu: Bir istatistiksel paket araştırmacı tarafından sağlanan gözlem listesinden (yani bir örnek) başlayarak nasıl var / cov matrisi üretebilir?


Gözlemlerinizin hataları rastgele değişkenlerin (y) fonksiyonudur ve bu nedenle kendileri rastgele olurlar. Sadece X'e bağlı olarak verilmezler.
user603

1
Evet, tamamen katılıyorum. Ama söyledikleriniz teoride işe yarıyor. Aynı popülasyondan aynı boyutta 100 rastgele örnek çizersem, her gözlem hatası (0, sigma ^ 2) ile rastgele bir değişken olacaktır. Bunun yerine, yalnızca bir örnek çizersem ne olur? Bu durumda, her gözlemdeki hatanın ortalaması hatanın kendisidir. Söylediklerim net mi? Peki, anlamaya çalıştığım, Stata gibi bir paket popülasyondan sadece bir örnek kullanarak varyans-kovaryans matrisini nasıl hesaplıyor?
Riccardo

Yanıtlar:


7

tipinde bir model için kovaryans matrisi genellikle ( X t X ) - 1 σ 2 olarak hesaplanıry=Xβ+ε σ2, rezidüel kareler toplamıdırσ2=Σi(yı-Xi β )2vedserbestlik derecesi (tipik olarak gözlem sayısı eksi parametrelerinin sayısı).

(XtX)-1σ2d
σ2σ2=Σben(yben-Xbenβ^)2d

Sağlam ve / veya kümelenmiş standart hatalar için ürünü hafifçe değiştirilir. Kovaryans matrisini hesaplamanın başka yolları da olabilir, örneğin dış ürünlerin beklentisiyle önerildiği gibi.XtX


3
  1. EKK tahmin ait hata varyansı , :σ2

s2=ε^ε^n-p

Bu, Julian J. Faraway tarafından R kullanılarak Pratik Regresyon ve Anova'ya dahil edilmiştir , sayfa 21 .

Mil başına galon dahil çoklu araba modeli özellikleri üzerinde geriledi doğrusal modele dayalı Ar yılında hesaplanması, örnek mtcarsveritabanı: ols = lm(mpg ~ disp + drat + wt, mtcars). Bunlar manuel hesaplamalar ve lm()işlevin çıktısıdır :

> rdf = nrow(X) - ncol(X)                    # Residual degrees of freedom
> s.sq = as.vector((t(ols$residuals) %*% ols$residuals) / rdf) 
>                                            # s square (OLS estimate of sigma square)
> (sigma = sqrt(s.sq))                       # Residual standar error
[1] 2.950507
> summary(ols)

Call:
lm(formula = mpg ~ disp + drat + wt, data = mtcars)
...
Residual standard error: 2.951 on 28 degrees of freedom
  1. β^

Vbirr[β^|X]=σ2(XX)-1

bu online belgenin sayfa 8'de olarak tahmin olarak

Vbirr^[β^|X]=s2(XX)-1
> X = model.matrix(ols)                             # Model matrix X
> XtX = t(X) %*% X                                  # X transpose X
> Sigma = solve(XtX) * s.sq                         # Variance - covariance matrix
> all.equal(Sigma, vcov(ols))                       # Same as built-in formula
[1] TRUE
> sqrt(diag(Sigma))                                 # Calculated Std. Errors of coef's
(Intercept)        disp        drat          wt 
7.099791769 0.009578313 1.455050731 1.217156605 
> summary(ols)[[4]][,2]                             # Output of lm() function
(Intercept)        disp        drat          wt 
7.099791769 0.009578313 1.455050731 1.217156605 

2

Y=β*X+εYXβXY


Merhaba Rajiv, düzeltme için teşekkür ederim. Peki, Stata'nın (veya başka bir istatistik paketinin) Y'den (ve epsilondan) nasıl varyans-kovaryans matrisi Sigma'yı türetmeyi başardığını açıklayabilir misiniz?
Riccardo

e^e^'

User603 ile aynı fikirde. Lütfen cran.r-project.org/doc/contrib/Faraway-PRA.pdf sayfasının 21. sayfasını kontrol edin . Bu R'ye dayanır, ancak doğrusal regresyonun arkasındaki teori hakkında iyi bir tartışma içerir.
Rajiv Sambasivan

Merhabalar, teşekkürler, her şeyden önce. Size de katılıyorum user603 ve bu cevabı bekliyordum. Ancak, hata vektörlerinin dış çarpımını hesaplayarak hesapladığı var / cov matrisi, bu, çoğu durumda hata bileşenleri arasındaki cov'un bağımsızlık hipotezinin göstereceği gibi sıfır olmayacağı anlamına gelir. Sağ? Benim kuşkum budur. Rajiv, önerdiğin iyi rehbere baktım ama bir cevap bulamadım. İleride cevap vermeniz için şimdiden teşekkür ederiz.
Riccardo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.