RSS neden kare kare np dağıtıyor?


28

OLS modeli altında, RSS (artık kareler toplamı) değerinin χ 2( n - p )

χ2(np)
( p ) neden dağıldığını anlamak istiyorum.p modelinde parametrelerinin sayısı, varlık nn gözlem sayısı).

Bu kadar temel bir soruyu sorduğum için özür dilerim, ancak cevabı çevrimiçi olarak bulamıyorum (ya da benim uygulama alanım olan ders kitaplarında).


3
Cevapların iddianın pek doğru olmadığını gösterdiğine dikkat edin: RSS'in dağılımı σ 2σ2 ( n - p değil np) çarpı χ 2 ( n - p )χ2(np) dağılımdır, burada σ 2σ2 hataların gerçek varyansıdır.
whuber

Yanıtlar:


36

Aşağıdaki doğrusal modeli göz önünde bulundururum: y = X β + ϵy=Xβ+ϵ .

Artıkların vektörü ile tahmin edilir

Ε =Y-X β =(I-X(X'X)-1x')y=Q,Y=S(xβ+ε)=Q,ε

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ

burada Q, = I - X ( X ' X ) - 1 x 'Q=IX(XX)1X .

Gözlemleyin tr ( S ) = N - p (iz siklik permütasyonu değişmez) ve Q ' = S = S 2 . Q'nun özdeğerleri bu nedenle 0 ve 1'dir (aşağıda bazı detaylar). Bu nedenle, bir üniter matris vardır V şekilde ( matrisler üniter matrislerle köşegenleştirilebilir ve normal sadece eğer. )tr(Q)=npQ=Q=Q2Q01V

V ' S V = Δ = tanılama ( 1 , ... , 1 n - p  kez , 0 , ... , 0 s  kere )

VQV=Δ=diag(1,,1np times,0,,0p times)

Şimdi, let K = V ' £ değenni .K=Vϵ^

Yana ε ~ N ( 0 , σ 2 Q ) , elimizdeki K ~ N ( 0 , σ 2 Δ ) ve bu nedenle, K , n - p + 1 = ... = K , n = 0 . Böyleceϵ^N(0,σ2Q)KN(0,σ2Δ)Knp+1==Kn=0

K 2σ 2 =K2σ 2χ 2 n - p

K2σ2=K2σ2χ2np

ile K = ( K 1 , ... , K , n - p ) ' .K=(K1,,Knp)

Dahası, V üniter bir matris olduğundan,V

Ε2 = K 2 = K 2

ϵ^2=K2=K2

Böylece

RSSσ 2χ 2 n - p

RSSσ2χ2np

Son olarak, bu sonucun ima ettiğini gözlemleyin.

E ( RSS)N - p )=σ2

E(RSSnp)=σ2

Yana S 2 - Q = 0 , en az bir polinom arasında Q polinom böler z 2 - z . Dolayısıyla, Q'nun öz değerleri 0 ile 1 arasındadır . Yana tr ( S ) = N - p ayrıca sayıda ile çarpılır özdeğerler toplamı olduğu için, zorunlu olarak bu var 1 çokluğu olan bir özdeğeridir N - p sıfır çokluğu olan bir özdeğeridir p .Q2Q=0Qz2zQ01tr(Q)=np1npp


1
(+1) İyi cevap. Bir yerine üniter, bir ortogonal dikkat kısıtlayabilir V yana S gerçek ve simetriktir. Ayrıca, S C R nedir? Tanımlanmış görmüyorum. Argümana biraz alıştırarak, aşina olmayanlara biraz da olsa bir dejenere normal kullanmaktan da kaçınılabilir. VQSCR
kardinal

2
@Cardinal. İyi bir nokta. SCR (fransızca 'Somme des Carrés Résiduels') RSS olmalıydı.
ocram

Thank you for the detailed answer Ocram! Some steps will require me to look more, but I have an outline to think about now - thanks!
Tal Galili

@Glen_b: Oh, I made an edit a couple of days ago to change SCR to SRR. I didn't remember that SCR is mentionned in my comment. Sorry for the confusion.
ocram

@Glen_b: It was supposed to mean RSS :-S Edited again. Thx
ocram

9

IMHO, the matricial notation Y=Xβ+ϵY=Xβ+ϵ complicates things. Pure vector space language is cleaner. The model can be written Y=μ+σGY=μ+σG where GG has the standard normal distributon on RnRn and μμ is assumed to belong to a vector subspace WRnWRn.

Now the language of elementary geometry comes into play. The least-squares estimator ˆμμ^ of μμ is nothing but PWYPWY: the orthogonal projection of the observable YY on the space WW to which μμ is assumed to belong. The vector of residuals is PWYPWY: projection on the orthogonal complement WW of WW in RnRn. The dimension of WW is dim(W)=ndim(W)dim(W)=ndim(W).

Finally, PWY=PW(μ+σG)=0+σPWG,

PWY=PW(μ+σG)=0+σPWG,
and PWGPWG has the standard normal distribution on WW, hence its squared norm has the χ2χ2 distribution with dim(W)dim(W) degrees of freedom.

This demonstration uses only one theorem, actually a definition-theorem:

Definition and theorem. A random vector in RnRn has the standard normal distribution on a vector space URnURn if it takes its values in UU and its coordinates in one ( in all) orthonormal basis of U are independent one-dimensional standard normal distributions

(from this definition-theorem, Cochran's theorem is so obvious that it is not worth to state it)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.