Bu sorunun 3,23 sayfada 97 arasında Hastie vd., İstatistiksel Öğrenme Unsurları , 2. ed. (5. baskı) .
Bu sorunun anahtarı, sıradan en küçük karelerin (yani doğrusal regresyon), özellikle de takılan değerlerin ve artıkların dikgenliğinin iyi anlaşılmasıdır.
Ortogonallik lemması : Let olması , tasarım matris yanıt vektörü ve (doğru) parametreleri. Varsayarsak (biz boyunca olacak olan), OLS tahminleri tam sıralaması olan olan . Takılan değerler . Sonra . Yani, takılan değerler artıklara diktir . O zamandan beri takip ediyorXn×pyβXββ^=(XTX)−1XTyy^=X(XTX)−1XTy⟨y^,y−y^⟩=y^T(y−y^)=0XT(y−y^)=XTy−XTX(XTX)−1XTy=XTy−XTy=0.
Şimdi izin ver xj öyle bir sütun vektörü olun ki xj bu jsütunu X. Varsayılan koşullar:
- 1N⟨xj,xj⟩=1 her biri için j, 1N⟨y,y⟩=1,
- 1N⟨xj,1p⟩=1N⟨y,1p⟩=0 nerede 1p uzunluğunu gösteren bir vektörü belirtir p, ve
- 1N|⟨xj,y⟩|=λ hepsi için j.
Not o özellikle , son deyimi ortogonalitenin lemmasının aynıdır⟨xj,y−y^⟩=0 hepsi için j.
Korelasyonlar bağlı
Şimdi, u(α)=αXβ^=αy^. Yani,
⟨xj,y−u(a)⟩=⟨xj,(1−α)y+αy−αy^⟩=(1−α)⟨xj,y⟩+α⟨xj,y−y^⟩,
ve sağ taraftaki ikinci terim
diklik lemması tarafından sıfırdır , yani
1N|⟨xj,y−u(α)⟩|=(1−α)λ,
istediğiniz gibi. Korelasyonların mutlak değeri sadece
ρ^j(α)=1N|⟨xj,y−u(α)⟩|1N⟨xj,xj⟩−−−−−−−−√1N⟨y−u(α),y−u(α)⟩−−−−−−−−−−−−−−−−−−√=(1−α)λ1N⟨y−u(α),y−u(α)⟩−−−−−−−−−−−−−−−−−−√
Not : Yukarıdaki sağ taraf aşağıdakilerden bağımsızdırj ve pay, kovaryans ile aynıdır, çünkü tüm xjve y merkezlenmiştir (bu nedenle özellikle ortalamanın çıkarılması gerekmez).
Amaç ne? Gibiαtepki vektörü, sadece ilkinin dahil edilmesinden elde edilen ( sınırlı! ) en küçük kareler çözümüne doğru ilerleyecek şekilde değiştirilir.pparametreler. Bu, aynı zamanda tahmini parametreleri değiştirir, çünkü bunlar (değiştirilmiş) cevap vektörü olan öngörücülerin basit iç ürünleridir. Değişiklik özel bir biçim alır. Bu (büyüklüğünü) belirleyicileri ve modifiye edilmiş tepki (halde işlemi boyunca aynı korelasyonları tutar değeri korelasyon değişiyor). Bunun geometrik olarak ne yaptığını düşünün ve prosedürün adını anlayacaksınız!
(Mutlak) korelasyonun açık formu
Pay zaten gerekli biçimde olduğundan, paydadaki terime odaklanalım. Sahibiz
⟨ y- u ( α ) , y- u ( α ) ⟩ = ⟨ ( 1 - α ) y+ α y- u ( α ) , ( 1 - α ) y+ α y- u ( α ) ⟩ .
İçinde değiştirme u ( α ) = αy^ ve iç ürünün doğrusallığını kullanarak,
⟨ y- u ( α ) , y- u ( α ) ⟩ = ( 1 - α)2⟨ y, y⟩+2α(1−α)⟨y,y−y^⟩+α2⟨y−y^,y−y^⟩.
Bunu gözlemleyin
- ⟨y,y⟩=N varsayımla,
- ⟨y,y−y^⟩=⟨y−y^,y−y^⟩+⟨y^,y−y^⟩=⟨y−y^,y−y^⟩Uygulayarak diklik lemma ortasında ikinci dönem (yine); ve,
- ⟨y−y^,y−y^⟩=RSS tanım olarak.
Tüm bunları bir araya getirdiğimizde,
ρ^j(α)=(1−α)λ(1−α)2+α(2−α)NRSS−−−−−−−−−−−−−−−−−√=(1−α)λ(1−α)2(1−RSSN)+1NRSS−−−−−−−−−−−−−−−−−−−−−√
Bir şeyleri sarmak için, 1−RSSN=1N(⟨y,y,⟩−⟨y−y^,y−y^⟩)≥0 ve böylece ρ^j(α) monoton olarak azalıyor α ve ρ^j(α)↓0 gibi α↑1.
Özet : Buradaki fikirlere odaklanın . Gerçekten sadece bir tane var. Ortagonalite lemma bizim için neredeyse tüm çalışır. Gerisi sadece cebir, gösterim ve bu son ikisini işe koyma yeteneğidir.