İyimserlik önyargısı - tahmin hatası tahminleri


9

İstatistiksel Öğrenmenin Unsurları (PDF'de çevrimiçi olarak mevcuttur) kitabında iyimserlik yanlılığı tartışılmaktadır (7.21, sayfa 229). İyimserlik yanlılığının eğitim hatası ile örnek içi hata arasındaki fark olduğunu belirtir (orijinal eğitim noktalarının her birinde yeni sonuç değerlerini örneklediğimizde gözlenen hata) (aşağıda).

resim açıklamasını buraya girin

Sonra, bu iyimserlik yanlılığını belirtiyor (ω), tahmini y değerlerimiz ve gerçek y değerlerimizin kovaryansına eşittir (aşağıdaki formül). Bu formülün neden iyimserlik yanlılığını gösterdiğini anlamakta güçlük çekiyorum; safça gerçek arasında güçlü bir kovaryans olduğunu düşünürdümy ve tahmin edildi yiyimserliği değil, yalnızca doğruluğu açıklar. Birinin formülün türetilmesine yardımcı olup olmadığı veya sezgiyi paylaşıp paylaşamayacağını bana bildirin.

resim açıklamasını buraya girin


Çok faydalı, teşekkürler! Denklemlerden birinin küçük bir yazım hatası olduğunu ve şöyle olması gerektiğini düşünüyorum:=1Ni=1N(Ey[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])
Sleepster

Yanıtlar:


8

Sezgiyle başlayalım.

Kullanmanın yanlış bir tarafı yok yi tahmin etmek y^i. Aslında, bunu kullanmamak değerli bilgileri attığımız anlamına gelir. Ancak, içerdiği bilgilere ne kadar bağlı olduğumuzyitahminimize ulaşmak için, tahmincimiz ne kadar iyimser olacak.

Bir uçta, eğer y^i sadece yi, örnek tahmininde mükemmel olacaksınız (R2=1), ancak örneklem dışı tahminin kötü olacağından eminiz. Bu durumda (kendiniz kontrol etmek kolaydır), özgürlük dereceleridf(y^)=n.

Diğer uçta, örnek ortalamasını kullanırsanız y: yi=yi^=y¯ hepsi için i, o zaman özgürlük dereceniz sadece 1 olacaktır.

Bu sezgi hakkında daha fazla bilgi için Ryan Tibshirani'nin bu güzel çalışma kağıdına göz atın


Şimdi diğer cevaba benzer bir kanıt, ancak biraz daha açıklama ile

Unutmayın ki, tanım gereği, ortalama iyimserlik:

ω=Ey(Errinerr¯)

=Ey(1Ni=1NEY0[L(Yi0,f^(xi)|T)]1Ni=1NL(yi,f^(xi)))

Şimdi ikinci dereceden bir kayıp fonksiyonu kullanın ve kare terimlerini genişletin:

=Ey(1Ni=1NEY0[(Yi0y^i)2]1Ni=1N(yiy^i)2))

=1Ni=1N(EyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

kullanım EyEY0[(Yi0)2]=Ey[yi2] değiştirmek:

=1Ni=1N(Ey[yi2]+Ey[yi^2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

=2Ni=1N(E[yiy^i]Ey[yi]Ey[y^i])

Bitirmek için şunu unutmayın: Cov(x,w)=E[xw]E[x]E[w], hangi verir:

=2Ni=1NCov(yi,y^i)

5
İsminin "Ryan Tibshirani" olarak yazıldığını belirtmeliyim Rob Tibshirani
robert tibshirani

2
Sitemize hoş geldiniz Rob - sadece bir hatayı düzeltmek için burada olmanız bir ayrıcalıktır! Başka bir şey görürseniz, lütfen bize bildirin: ve elbette sizin (veya öğrencilerinizin) yayınlamak isteyebileceği cevaplardan memnuniyet duyarız. Çalışmanız bu sitede, özellikle ESL ve Bootstrap'a Giriş'te
whuber

Zihin açıklıyor EyEY0[(Yi0)2]=Ey[yi2]? Ayrıca,2EyEY0[Yi0y^i]=2Ey[EY0[Yi0]EY0[y^i]]=2Ey[yi]Ey[y^i]?
Çerez

7

İzin Vermek f^(xi)=y^i, sonra

ω=Ey[op]=Ey[Errinerr¯]=Ey[Errin]Ey[err¯]=Ey[1Ni=1NEY0[L(Yi0,f^(xi))]Ey[1Ni=1NL(yi,f^(xi))]=1Ni=1NEyEY0[(Yi0y^i)2]Ey[(yiy^i)2]=1Ni=1NEyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=1Ni=1NEy[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=2Ni=1NEy[yiy^i]Ey[yi]Ey[y^i]=2Ni=1NEy[yiy^iyiEy[y^i]Ey[yi]y^i+Ey[yi]Ey[y^i]]=2Ni=1NEy[(y^iEy[y^i])([yiEy[yi])]=2Ni=1Ncov(y^i,yi)
QED

1
Son dört adım, bu kovaryans özelliği ile basitleştirilebilir: E[xw]E[x]E[w]=Cov(x,w)
cd98
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.