Doğrusal regresyonda sapma-varyans dengesinin grafiksel bir temsili var mı?


18

Bir elektrik kesintisi yaşıyorum. Doğrusal regresyon bağlamında önyargı-varyans dengesini sergilemek için aşağıdaki tabloyu sundum:

Veri için polinom modeli, basit ve karmaşık durum

İki modelden hiçbirinin iyi bir uyum olmadığını görebiliyorum - "basit", XY ilişkisinin karmaşıklığını takdir etmiyor ve "karmaşık", temel olarak eğitim verilerini ezbere öğreniyor. Ancak bu iki resimdeki sapma ve sapmayı tamamen göremiyorum. Birisi bunu bana gösterebilir mi?

Not: Önyargı-varyans dengesinin sezgisel açıklamasına cevap ? Bana gerçekten yardım etmedi, birileri yukarıdaki resme dayanarak farklı bir yaklaşım sağlayabilirse sevinirim.

Yanıtlar:


11

Önyargı varyans ödemesi, ortalama kare hatasının dökümüne dayanmaktadır:

MSE(y^)=E[yy^]2=E[yE[y^]]2+E[y^E[y^]]2

Sapma-varyans ticaretini görmenin bir yolu, veri setinin hangi özelliklerin modele uygun olarak kullanıldığıdır. Basit model için, OLS regresyonunun düz çizgiye uyması için kullanıldığını varsayarsak, çizgiye uymak için sadece 4 sayı kullanılır:

  1. X ve y arasındaki örnek kovaryans
  2. X'in örnek varyansı
  3. X örnek ortalaması
  4. Y örnek ortalaması

Böylece, aynı 4 sayıya giden herhangi bir grafik tam olarak aynı takılı çizgiye (10 puan, 100 puan, 100000000 puan) yol açacaktır. Dolayısıyla, bir anlamda, gözlemlenen belirli örneğe duyarsızdır. Bu, verilerin bir kısmını etkili bir şekilde göz ardı ettiği için "taraflı" olacağı anlamına gelir. Verilerin göz ardı edilen bir kısmı önemliyse, tahminler tutarlı bir şekilde hatalı olacaktır. Takılan hattı tüm verileri kullanarak bir veri noktasının çıkarılmasından elde edilen takılan hatlarla karşılaştırırsanız bunu göreceksiniz. Oldukça kararlı olma eğilimindedirler.

Şimdi ikinci model elde edebileceği her veri parçasını kullanıyor ve verilere mümkün olduğunca yakın. Bu nedenle, her veri noktasının kesin konumu önemlidir ve bu nedenle, OLS için olduğu gibi takılan modeli değiştirmeden egzersiz verilerini değiştiremezsiniz. Bu nedenle model, sahip olduğunuz özel eğitim setine çok duyarlıdır. Aynı açılan veri noktası grafiğini yaparsanız, takılan model çok farklı olacaktır.


θ^y^θx,y

y^θ^

Parametre tahmini için İçeride ISTV melerin RWMAIWi'nin , onun önyargı b i bir s ( θ ) = θ - E [ θ ] , ama θ doğru, bize bilinmemektedir? Dahası, veri seti göz önüne alındığında, gerçek modelin neye benzemesi gerektiği konusunda hiçbir fikrimiz yok, örneğin verilerin arkasındaki gerçek model f ( x ) = a + b x + c x 2'dir , ancak doğrusal bir regresyon modeli seçiyoruz h ( x ) = d +θ^bias(θ^)=θE[θ^]θf(x)=a+bx+cx2 verilere uyacak şekilde, bu yüzden paradoks geliyor: gerçek parametreler ( a , b , c ) , tahmin etmeye çalışmamız gereken hedef, ancak ( d , e ) tahminleri ile sonuçlanıyoruz, b i a s ( d ) ve b i a s ( e ) ' yi hesaplamak veya analiz etmek? h(x)=d+ex(a,b,c)(d,e)bias(d)bias(e)
avokado

@loganecolss - önyargı kavramı yalnızca "yerel olarak" var olduğu için, yani belirli bir istatistiksel modele göre, bu bir paradoks değildir. "Paradoks" şu kişiler için vardır: 1) "gerçek modeli" bilir ve 2) onu kullanmamaya karar verir. O kişi kitabımda bir salak. "Gerçek modeli" bilmiyorsanız, o zaman bir sorun yoktur - iyi bir model bulamadıysanız ve kullanmamaya karar
probabilityislogic

1
f(x,z1,z2,,zK)ziK
probabilityislogic

5

Matematiksel olmayan bir şekilde bildiklerimi özetlemek gerekirse:

  • önyargı - basit modeli kullandığınızda tahmininiz yanlış olur ve bu, modeli kullandığınız herhangi bir veri kümesinde gerçekleşir. Tahmininizin yanlış olması bekleniyor
  • varyans - karmaşık modeli kullanırsanız, hangi veri kümesini kullandığınıza bağlı olarak çok farklı bir tahmin elde edersiniz

Bu sayfa, yayınladıklarınıza benzer diyagramlarla oldukça iyi bir açıklamaya sahip. (Sadece şemaları ile parçasını okumak olsa üst kısmı atlanır) http://www.aiaccess.net/English/Glossaries/GlosMod/e_gm_bias_variance.htm (eğer haber vermedi durumda farklı bir örnek mouseover gösterileri!)


Bu ilginç bir sayfa ve iyi çizimler, ancak onları daha sonra kafa karıştırıcı buluyorum çünkü (a) regresyon bağlamında tartışılan "önyargı" ve "sapma", bunun başında tanımlanan önyargı ve sapma gibi görünmüyor (b) yapılan ifadelerin (parametre sayısı ile sapma ve sapmanın nasıl değiştiği hakkında) doğru olmadığı açık değildir.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.