Evet, tüm değişkenlerin kovaryans matrisi - açıklayıcı ve yanıt - modele bir müdahale (sabit) terimi dahil edilmesi koşuluyla, tüm katsayıları bulmak için gerekli bilgileri içerir. (Kovaryanslar sabit terim hakkında bilgi vermemesine rağmen, veri araçlarından bulunabilir.)
analiz
Açıklayıcı değişkenler için verinin, -boyutlu sütun vektörleri ve değişkeni , rastgele bir değişkeni olduğunun düşünüldüğü sütun vektörü olarak düzenlensin . Sıradan en küçük kareler modeldeki katsayıların değerini tahmin edernx1,x2,…,xpyYβ^
E(Y)=α+Xβ
birleştirilmesiyle elde edilir sütun vektörlerinin bir içine dizisi ve doğrusal denklem sisteminin çözülmesip+1X0=(1,1,…,1)′,X1,…,Xpn×p+1X
X′Xβ^=X′y.
Sisteme eşdeğerdir
1nX′Xβ^=1nX′y.
Gauss ortadan kaldırılması bu sistemi çözecektir. Bu bitişik ile çalışır matrisi ve -vector bir içine dizi ve satır azalması. p+1×p+11nX′Xp+11nX′yp+1×p+2A
İlk adım . Bunun sıfır olmadığını tespit ederek , ilk sütunundaki kalan girişleri sıfırlamak için ilk satırının uygun katlarını kalan satırlardan çıkarmaya devam eder. Bu katları olacak ve giriş çıkartılmaktadır sayısı eşit olur . Bu sadece ve kovaryansı için bir formül . Dahası, konumunda bırakılan sayı , değerine eşittir.1n(X′X)11=1nX′0X0=1A1nX′0Xi=X¯¯¯¯iAi+1,j+1=X′iXjX¯¯¯¯iX¯¯¯¯jXiXji+1,p+21nX′iy−Xi¯¯¯¯¯¯y¯¯¯, ile kovaryansı .Xiy
Böylece, Gauss elemesinin ilk basamağından sonra sistem çözülmeye indirgenmiştir.
Cβ^=(Cov(Xi,y))′
ve açıkçası - tüm katsayılar kovaryans olduklarından - bu çözüm tüm değişkenlerin kovaryans matrisinden bulunabilir.
( tersinirse çözüm verilen formüller ve olduğunda bunun özel durumlarıdır. tür formüllerin açıkça yazılması, büyüdükçe gittikçe daha karmaşık hale gelecektir.Ayrıca , en azından matrisini tersine çevirmek yerine denklemler sistemi çözülerek yapılan sayısal hesaplamada yetersiz kalmaktadırlar .)CC−1(Cov(Xi,y))′p=1p=2pC
Sabit terim, ortalaması ile tahminlerden tahmin edilen ortalama değerler arasındaki fark olacaktır , .yXβ^
Örnek
Açıklamak gerekirse, aşağıdaki Rkod bazı veriler oluşturur, kovaryanslarını hesaplar ve en küçük kareler katsayısı tahminlerini yalnızca bu bilgilerden elde eder. Onları en küçük kareler tahmin edicisinden elde edilen tahminlerle karşılaştırır lm.
#
# 1. Generate some data.
#
n <- 10 # Data set size
p <- 2 # Number of regressors
set.seed(17)
z <- matrix(rnorm(n*(p+1)), nrow=n, dimnames=list(NULL, paste0("x", 1:(p+1))))
y <- z[, p+1]
x <- z[, -(p+1), drop=FALSE];
#
# 2. Find the OLS coefficients from the covariances only.
#
a <- cov(x)
b <- cov(x,y)
beta.hat <- solve(a, b)[, 1] # Coefficients from the covariance matrix
#
# 2a. Find the intercept from the means and coefficients.
#
y.bar <- mean(y)
x.bar <- colMeans(x)
intercept <- y.bar - x.bar %*% beta.hat
Çıktı, iki yöntem arasındaki anlaşmayı gösterir:
(rbind(`From covariances` = c(`(Intercept)`=intercept, beta.hat),
`From data via OLS` = coef(lm(y ~ x))))
(Intercept) x1 x2
From covariances 0.946155 -0.424551 -1.006675
From data via OLS 0.946155 -0.424551 -1.006675