R kare için koşullu beklenti


18

Basit doğrusal modeli düşünün:

yy=Xββ+ϵ

nerede ϵii.i.d.N(0,σ2) ve XRn×p ,p2 veX bir sabit sütun içerir.

Sorum verilir E(XX) , β ve σ , önemsiz olmayan üst üzerine bağlanmış bir formül olduğu E(R2) *? (modelin OLS tarafından tahmin edildiği varsayılarak).

* Ben, bu yazma, farz olduğunu alma E(R2) kendisi mümkün olmazdı.

Edit1

Stéphane Laurent türetilen çözeltisi kullanılarak, çok yüksek ile bağlanmış bir önemsiz olmayan elde edilebilir (aşağıya bakınız) E(R2) . Bazı sayısal simülasyonlar (aşağıda) bu sınırın aslında oldukça sıkı olduğunu göstermektedir.

: Stéphane Laurent, aşağıdaki edilen B ( s - 1 , n - p , λ ) olmayan dışmerkezlik parametresi olmayan bir merkezi beta dağılımı λ ileR2B(p1,np,λ)B(p1,np,λ)λ

λ=||XβE(X)β1n||2σ2

Yani

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

burada , λ parametresi ve k serbestlik derecesi ile merkezi olmayan bir χ 2'dir . Üst giden bir önemsiz olmayan yüzden E ( R, 2 ) olduğuχk2(λ)χ2λkE(R2)

λ+p1λ+n1

öyle çok (ben mümkün olacağını beklediğim daha çok sıkı) sıkı:

örneğin:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

ortalama 1000 simülasyonlar olup . Yukarıdaki teorik üst sınır verir . Bağlı birçok değerleri arasında eşit olarak hassas gibi görünmektedir R 2 . Gerçekten şaşırtıcı!R20.9608190.9609081R2

EDIT2:

daha fazla araştırma sonra, görünür için üst sınır yaklaşım kalitesi, daha iyi bir şekilde alacakE(R2) artar (ve her şey eşit, λ birlikte artar n ).λ+pλn


parametreler sadece bağlı olarak bir beta dağılımına sahiptir , n ve s . Hayır ? R2np
Stéphane Laurent

1
Üzgünüm, önceki iddiam sadece "boş model" hipotezi altında doğrudur (sadece engelleme). Aksi dağılımı bilinmeyen parametreleri içeren bir noncentrality parametresi olan bir konsolide bütçe dışında kalan Beta dağılımı gibi bir şey olmalıdır. R2
Stéphane Laurent

@ StéphaneLaurent: teşekkürler. Bilinmeyen parametreler ile Beta parametreleri arasındaki ilişki hakkında daha fazla şey biliyor musunuz?
Sıkıştım

Kesinlikle başa gerekiyor mu ? Belki de basit bir tam formül yoktur , E [ R 2 / ( 1 - R 2 ) ] . E[R2]E[R2/(1R2)]
Stéphane Laurent

1
Benim cevap gösterimler ile bazı sayıl için kR2/(1R2)=kFk ve konsolide bütçe dışında kalan ilk andan -Dağıtım basittir. F
Stéphane Laurent

Yanıtlar:


13

Herhangi bir doğrusal model yazılabilir burada G, standart normal bir dağılıma sahip , R , n ve μ lineer alt alana ait olduğu varsayılır W arasında R n . Sizin durumunuzda W = Im ( X ) .Y=μ+σGGRnμWRnW=Im(X)

Let vektörü tarafından oluşturulan tek boyutlu doğrusal alt uzayı ( 1 , 1 , ... , 1 ) . Çekilmesi U = [ 1 ] Aşağıdaki, R ' 2 yüksek klasik Fisher istatistiği ile ilgilidir F = P , Z , Y 2 / ( m - )[1]W(1,1,,1)U=[1]R2H0 hipotez testi için:{μU}buradaUWdoğrusal bir alt uzaydır ve Z=UWileU'nunortogonal tamamlayıcısıdıriçerisindeWve belirtenm=dim(B)ve=loş(om=

F=PZY2/(m)PWY2/(nm),
H0:{μU}UWZ=UWUWm=dim(W)=dim(U) vem=pdurumunuzda = 1 ).=1

Aslında, tanımı, çünküR2olan R '2=p , Z , Y 2

PZY2PWY2=R21R2
R2
R2=PZY2PUY2=1PWY2PUY2.

Açıkçası ve P W , Y = σ p B G .PZY=PZμ+σPZGPWY=σPWG

Zaman doğrudurH0:{μU} sonra ve bu nedenle F = P , Z G 2 / ( m - )PZμ=0 FisherFm-,n-mdağılımına sahiptir. Sonuç olarak, Fisher dağılımı ve Beta dağılımı arasındaki klasik ilişkiden,R,2~B(m,-,n-

F=PZG2/(m)PWG2/(nm)Fm,nm
Fm,nm .R2B(m,nm)

Genel durumda biz uğraşmak zorunda zaman P , Z ^ ı 0 . Bu genel durumda, P Z Y 2σ 2 χ 2 m - ( λ ) , m - serbestlik derecesi ve merkez dışılık parametresi P Z μ ile merkezi olmayan χ 2 dağılımıPZY=PZμ+σPZGPZμ0PZY2σ2χm2(λ)χ2mλ=PZμ2σ2FFm,nm(λ)F

R2mnmλ

PZμPZ=PWPUPUμ=μ¯1U=[1]PWμ=μPZμ=μμ¯1μ=Xββ


1
PZxxZP

1
dikkat edinPxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent

1
Done - do you see any simplification ?
Stéphane Laurent

1
μ¯=1nμi
Stéphane Laurent

1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.