Evet, tüm değişkenlerin kovaryans matrisi - açıklayıcı ve yanıt - modele bir müdahale (sabit) terimi dahil edilmesi koşuluyla, tüm katsayıları bulmak için gerekli bilgileri içerir. (Kovaryanslar sabit terim hakkında bilgi vermemesine rağmen, veri araçlarından bulunabilir.)
analiz
Açıklayıcı değişkenler için verinin, -boyutlu sütun vektörleri ve değişkeni , rastgele bir değişkeni olduğunun düşünüldüğü sütun vektörü olarak düzenlensin . Sıradan en küçük kareler modeldeki katsayıların değerini tahmin edernx1,x2,…,xpyYβ^
E(Y)=α+Xβ
birleştirilmesiyle elde edilir sütun vektörlerinin bir içine dizisi ve doğrusal denklem sisteminin çözülmesip+1X0=(1,1,…,1)′,X1,…,Xpn×p+1X
X′Xβ^=X′y.
Sisteme eşdeğerdir
1nX′Xβ^=1nX′y.
Gauss ortadan kaldırılması bu sistemi çözecektir. Bu bitişik ile çalışır matrisi ve -vector bir içine dizi ve satır azalması. p+1×p+11nX′Xp+11nX′yp+1×p+2A
İlk adım . Bunun sıfır olmadığını tespit ederek , ilk sütunundaki kalan girişleri sıfırlamak için ilk satırının uygun katlarını kalan satırlardan çıkarmaya devam eder. Bu katları olacak ve giriş çıkartılmaktadır sayısı eşit olur . Bu sadece ve kovaryansı için bir formül . Dahası, konumunda bırakılan sayı , değerine eşittir.1n(X′X)11=1nX′0X0=1A1nX′0Xi=X¯¯¯¯iAi+1,j+1=X′iXjX¯¯¯¯iX¯¯¯¯jXiXji+1,p+21nX′iy−Xi¯¯¯¯¯¯y¯¯¯, ile kovaryansı .Xiy
Böylece, Gauss elemesinin ilk basamağından sonra sistem çözülmeye indirgenmiştir.
Cβ^=(Cov(Xi,y))′
ve açıkçası - tüm katsayılar kovaryans olduklarından - bu çözüm tüm değişkenlerin kovaryans matrisinden bulunabilir.
( tersinirse çözüm verilen formüller ve olduğunda bunun özel durumlarıdır. tür formüllerin açıkça yazılması, büyüdükçe gittikçe daha karmaşık hale gelecektir.Ayrıca , en azından matrisini tersine çevirmek yerine denklemler sistemi çözülerek yapılan sayısal hesaplamada yetersiz kalmaktadırlar .)CC−1(Cov(Xi,y))′p=1p=2pC
Sabit terim, ortalaması ile tahminlerden tahmin edilen ortalama değerler arasındaki fark olacaktır , .yXβ^
Örnek
Açıklamak gerekirse, aşağıdaki R
kod bazı veriler oluşturur, kovaryanslarını hesaplar ve en küçük kareler katsayısı tahminlerini yalnızca bu bilgilerden elde eder. Onları en küçük kareler tahmin edicisinden elde edilen tahminlerle karşılaştırır lm
.
#
# 1. Generate some data.
#
n <- 10 # Data set size
p <- 2 # Number of regressors
set.seed(17)
z <- matrix(rnorm(n*(p+1)), nrow=n, dimnames=list(NULL, paste0("x", 1:(p+1))))
y <- z[, p+1]
x <- z[, -(p+1), drop=FALSE];
#
# 2. Find the OLS coefficients from the covariances only.
#
a <- cov(x)
b <- cov(x,y)
beta.hat <- solve(a, b)[, 1] # Coefficients from the covariance matrix
#
# 2a. Find the intercept from the means and coefficients.
#
y.bar <- mean(y)
x.bar <- colMeans(x)
intercept <- y.bar - x.bar %*% beta.hat
Çıktı, iki yöntem arasındaki anlaşmayı gösterir:
(rbind(`From covariances` = c(`(Intercept)`=intercept, beta.hat),
`From data via OLS` = coef(lm(y ~ x))))
(Intercept) x1 x2
From covariances 0.946155 -0.424551 -1.006675
From data via OLS 0.946155 -0.424551 -1.006675