Doğrusal regresyonun sapma-varyans ayrışmasında varyans terimi


9

'İstatistiksel Öğrenmenin Unsurları' nda, doğrusal modelin sapma-varyans ayrışması ifadesi burada gerçek hedef fonksiyonudur, , modelindeki rastgele hatanın varyansıdır ve lineer tahmin olan .

Err(x0)=σϵ2+E[f(x0)Ef^(x0)]2+||h(x0)||2σϵ2,
f(x0)σϵ2y=f(x)+ϵf^(x)f(x)

Varyans terimi burada beni rahatsız ediyor çünkü denklem, hedefler gürültüsüz, yani ise varyansın sıfır olacağını ima ediyorAma bu bana mantıklı değil çünkü sıfır gürültü olsa bile , varyansın sıfır olmadığı anlamına gelen farklı eğitim setleri için farklı tahminciler .σϵ2=0.f^(x0)

Örneğin, hedef fonksiyonunun ikinci dereceden olduğunu ve egzersiz verilerinin bu ikinci dereceden rastgele örneklenmiş iki nokta içerdiğini varsayalım ; açıkça, kuadratik hedeften rastgele iki nokta her örneklediğimde farklı bir doğrusal uyum elde edeceğim. O halde varyans nasıl sıfır olabilir?f(x0)

Önyargı-varyans ayrışması anlayışımdaki neyin yanlış olduğunu bulmamda bana yardımcı olabilir mi?

Yanıtlar:


6

Önyargı ve varyans tedavilerinde her zaman gizlenen bir incelik vardır ve okurken buna dikkat etmek önemlidir. Bu bölümdeki bir bölümde ESL'nin ilk birkaç kelimesini tekrar okursanız, yazarlar buna biraz saygı gösterirler.

Hata oranı tahminiyle ilgili tartışmalar kafa karıştırıcı olabilir, çünkü hangi miktarların sabit ve hangilerinin rastgele olduğunu netleştirmeliyiz

İncelik sabit olan ve rastgele olan şeydir .

Geleneksel lineer regresyon tedavilerinde, verileri sabit ve bilinen olarak ele alınır. ESL'deki argümanları takip ederseniz, yazarların da bu varsayımı yaptığını göreceksiniz. Bu varsayımlar altında, örneğin verilen koşullu dağılımından geriye kalan tek rastgelelik kaynağı olarak örneğiniz devreye girmez . Eğer yardımcı olursa , zihninizdeki gösterimini ile değiştirmek isteyebilirsiniz .XyXErr(x0)Err(x0X)

Bu, endişenizin geçersiz olduğu anlamına gelmez, eğitim verilerinin seçiminin gerçekten de model algoritmamızda rastlantısallık getirdiğini ve gayretli bir uygulayıcının, bu rastgeleliğin sonuçları üzerindeki etkisini ölçmeye çalışacağı kesinlikle doğrudur. Aslında, bootstrapping ve çapraz validasyonun yaygın uygulamalarının bu rasgelelik kaynaklarını çıkarımlarına açıkça dahil ettiğini açıkça görebilirsiniz.

Rastgele bir eğitim veri seti bağlamında doğrusal bir modelin sapması ve sapması için açık bir matematiksel ifade türetmek için, verilerindeki rasgeleliğin yapısı hakkında bazı varsayımlar yapılması gerekir . Bu, dağılımı hakkında bazı varsayımlar içerecektir . Bu yapılabilir, ancak bu fikirlerin ana akım açıklamalarının bir parçası haline gelmemiştir.XX


Yazarların sabit olduğunu varsaydıkları gerçeğini temizlediğiniz için çok teşekkür ederiz , bu nedenle buradaki beklenti değil . Ancak yazabiliriz , bu da X'e rastgele davranmanın . sıfırsa yine de sıfır olur . Bu denklem hakkında benzer bir şüphem vardı, bu yazıda türetimi öğrenebilirsiniz : stats.stackexchange.com/questions/307110/…XY|X(X,Y)E=EXEY|XVar(f^(x0))=EX[||h(x0)||2σϵ2]σϵ2
Abhinav Gupta

Tahminimce yazarlar, modelin doğru bir şekilde belirtildiğini varsayarlar, yani doğru dönüşümleri olan tüm ve sadece ilgili tahmin edicileri içerir. Yine de onaylamak için belleğime güvenmek yerine kitaba geri dönmem gerekecekti.
Matthew Drury

Eğer 'doğru bir şekilde' belirtilmişse, hedef fonksiyonun gerçekten doğrusal olduğunu kastediyorsanız, sıfır gürültünün sıfır yanlılık anlamına geleceğini anlıyorum. Ancak hedef fonksiyon doğrusal olmasa bile, varyans için tam olarak aynı ifadeyi alıyoruz.
Abhinav Gupta

1
Bu doğrudur, ancak bu durumda "doğru bir şekilde belirtilmiş" , doğru tahmin edicileri içeren bir modele uymak için doğrusal regresyon kullandığınız anlamına gelir . Dolayısıyla, gerçek ilişki ikinci dereceden ise, modelinizin ikinci dereceden terimleri içerdiğini varsayarsınız.
Matthew Drury
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.