Bu ilginç bir soru. Şaşırtıcı bir şekilde, bazı varsayımlar altında bir şey yapmak mümkündür, ancak kalan varyans hakkında potansiyel bir bilgi kaybı vardır. Ne kadar kayıp olduğuna bağlıdır .X
Diyelim aşağıdaki tekil değer ayrışımı dikkate arasında ile bir dik sütunlu matris, , bir köşegen matris pozitif tekil değerler ile ve a dikey matris. Daha sonra sütunları ve
sütun boşlukları için ortonormal bir temel oluşturur
" , genişlemede bu sütun boşluğuna izdüşümü için katsayıların vektörüdür.X=UDVtXUn×pDd1≥d2≥...≥dp>0Vp×pUX
Z=UtY=D−1VtVDUtY=D−1VtXtY
YU sütun. Formülden sadece ve bilgisinden hesaplandığını görüyoruz .
ZXXtY
Belirli için sırt regresyon belirleyici yana olarak hesaplanabilir
, sütunu bazında
sırt regresyon tahmincisi için katsayıların olduğunu görüyoruz
Şimdi bu dağılım varsayımını sahiptir boyutlu ortalama ve kovaryans matrisi . Daha sonra sahiptir boyutlu ortalama ve kovaryans matrisi . Bağımsız bir hayal edersekλ
Y^=X(XtX+λI)−1XtY=UD(D2+λI)−1DUtY=UD(D2+λI)−1DZ
UZ^=D(D2+λI)−1DZ.
Ynξσ2InZpUtξσ2IpYNew ile aynı dağılımına sahip (koşullu her şeyi Buradan itibaren), karşılık gelen aynı sahip olarak dağıtılır ve bağımsızdır ve
Burada üçüncü eşitlik ve ve dördüncüsü,
YXZNew=UtYNewZE||YNew−Y^||2===E||YNew−UZNew+UZNew−UZ^||2E||YNew−UZNew||2+E||UZNew−UZ^||2Err0+E||ZNew−Z^||2.
YNew−UZNewUZNew−UZ^U birimdik sütunları vardır. miktarı , hakkında hiçbir bilgi alamadığımız bir hatadır, ancak da bağlı değildir . Sol taraftaki tahmin hatasını en aza indirmek için sağ taraftaki ikinci terimi en aza indirmeliyiz.
Err0λ
Standart bir hesaplama ile
Burada , parametresiyle sırt regresyonu için etkili serbestlik derecesi olarak bilinir . Tarafsız bir tahmin olduğu
E||ZNew−Z^||2==E||Z−Z^||2+2∑i=1pcov(Zi,Z^i)E||Z−Z^||2+2σ2∑i=1pd2id2i+λdf(λ).
df(λ)λE||Z−Z^||2err(λ)=||Z−Z^||2=∑i=1p(1−d2id2i+λ)2Z2i.
Bunu
, ın (tarafsız) tahmincisi
. , daha sonra küçültmemiz gereken bildiğimiz göz önüne alındığında . Bildiğimiz eğer Açıkçası, bu sadece yapılabilir veya makul bir at tahmin veya tahmin edicisi olan .
err(λ)+2σ2df(λ)
E||ZNew−Z^||2σ2σ2σ2
tahmini daha sorunlu olabilir. Göstermek mümkün olduğunu
Bu nedenle, , kare yanlılık göz ardı edilebilecek kadar küçük seçmek mümkünse, olarak
tahmin etmeye çalışabiliriz.
Bu işe yarayacaksa çok bağlıdır .σ2
E||Z−Z^||2=σ2⎛⎝⎜⎜⎜⎜⎜p−∑i=1pd2id2i+λ(2−d2id2i+λ)d(λ)⎞⎠⎟⎟⎟⎟⎟+bias(λ)2.
λσ2σ^2=1p−d(λ)||Z−Z^||2.
X
Bazı ayrıntılar Bölüm 3.4.1 ve Bölüm 7 için bkz ESL belki ya da daha da iyi Bölüm 2 GAM .