Büzülme akıllıca uygulanırsa, daha verimli tahminciler için her zaman daha iyi çalışır mı?


11

Aynı parametrenin tutarlı tahmin edicileri olan ve iki tahmincim olduğunu ve ile anlamında . Dolayısıyla, asimptotik olarak daha etkilidir . Bu iki tahminci farklı kayıp fonksiyonlarına dayanmaktadır. β 2β0β^1β^2β0V1V2 β 1 β 2

n(β^1β0)dN(0,V1),n(β^2β0)dN(0,V2)
V1V2β^1β^2

Şimdi, tahmincilerimin sonlu örnek özelliklerini geliştirmek için bazı büzülme tekniklerini aramak istiyorum.

Sonlu bir örnekte ve bana eşit MSE değerini veren bir büzülme tekniği bulduğumu varsayalım . Bu bana MSE den daha büyük olmayacak için geçerli bir büzülme tekniği bulabileceğim anlamına mı geliyor ? γ 2 β 1β^2γ^2β^1 γ^2

Başka bir deyişle, büzülme akıllıca uygulanırsa, daha verimli tahminciler için her zaman daha iyi çalışır mı?

Yanıtlar:


4

Kuşkusuz biraz sıkıcı bir karşı örnek önereyim. Söyle β 1 den sadece asimptotik daha etkili değildir p 2 , aynı zamanda Cramer Rao alt sınırı ulaşır. İçin bir akıllı çekme tekniği β 2 olacaktır: β * 2 = W β 2 + ( 1 - w ) β 1 ile ağırlık ( 0 , 1 ) . Asimptotik varyans P * 2β^1β^2β^2

β^2=wβ^2+(1w)β^1
w(0,1)β^2bir
V=Avar(wβ^2+(1w)β^1)=Avar(w(β^2β^1)+β^1)=V1+w2(V2V1)
, son eşitliğin Lemma'yıHausman'ın gazetesi . Biz
V2V=V2(1w2)V1(1w2)0
, böylece bir asimptotik bir risk iyileştirilmeleri (eğilim terimler vardır) vardır. Biz üzerinde bir miktar Asymptotic (ve dolayısıyla umarım sonlu örnek) iyileştirmeler veren bir büzülme tekniğini buldu Yani P 2 . Oysa hiçbir benzer büzülme tahmincisi var β * 1 Bu prosedürün takip eder.β^2β^1

Elbette buradaki nokta, büzülmenin verimli tahmin ediciye doğru yapılması ve bu nedenle verimli tahmin edicinin kendisi için geçerli olmamasıdır. Bu yüksek düzeyde oldukça açık gibi görünüyor, ancak belirli bir örnekte bu o kadar açık değildir ( tekdüze dağılım için MLE ve Momentler Yöntemi tahmincisi bir örnek olabilir mi?).


1
İlginç örnek için teşekkürler! (1) Ancak, bu bir karşı örnek olarak değerlendirilmesi gerektiğini bana net değil: hem asimptotik var ve bu göstermez β 1 aynı veya daha düşük riske sahip olarak geliştirilmiş edilemez. (Aslında, senin β * 2 otomatik, en iyi, aynı riski vardır β 1 .) Amacıyla counterexample, modifiye tahmincisi riskini sağlamak için β * 2 riski daha az olması gerekmektedir β 1 ve bu düzeni ile mümkün olduğunu açık değil. β^1β^2β^1β^2β^1
user795305

Teşekkürler ve alınan puanlar. Beni ancak hiçbir yerde söz konusu o belirtildi işaret edelim ki modifiye MSE β 2 daha düşük olması gerekir P 1 . Yani p2 bu bağlamda geçerli bir büzülme tekniğidir. Ama bunun sadece kısmi bir cevap olduğuna katılıyorum ve diğer insanların bu soru hakkında ne söyleyeceklerini görmek için sabırsızlanıyorum. β^2β^1β^2
Matthias Schmidtblaicher

1
"Bulduğumu varsayalım ..." ile başlayan paragrafta OP bunu belirtmiş gibi görünüyor. Yanlış anlıyor muyum? Daha sonra gelende, yıldız böylece değiştirilmiş tahmin edicileri gösterelim p * j = f j ( β j ) bazı (belki büzülme) fonksiyonları için f j . Bulmak biz düşünelim β * 2 , böylece r i'nin s k ( β 2 ) r ı s k ( β * 2 )β^j=fj(β^j)fjβ^2risk(β^2)risk(β^2). Başvurulan paragrafta, OP bazı bulabilirsek sorar böylece r i'nin s k ( β * 1 ) r i'nin s k ( β * 2 ) . f1risk(β^1)risk(β^2)
user795305

Anlıyorum. Eğer soru bu ise, basitçe kimliktir ve cevap örnekte olumludur. Biz bir işlev bulabilirsem ben soruyu okuma" f ( P , x ) olacak şekilde r i'nin s k ( f ( β 2 , x ) ) < r i'nin lar k ( β 2 ) , bir orada mevcut mu g ( β , x ) ve böylece r ı s kf1f(β,x)risk(f(β^2,x))<risk(β^2)g(β,x) "?risk(g(β^1,x))<risk(β^1)
Matthias Schmidtblaicher

1
Bu krediyi paylaştığınız için teşekkürler, sorunuzu gerçekten yanıtlamamış olsam da ...
Matthias Schmidtblaicher

-2

Bu, önce bazı önemli noktalara dikkat çekmek istediğim ilginç bir soru.

  • İki tahminci tutarlıdır
  • daha verimlidir p 2daha az varyasyon elde yanaβ^1β^2
  • Kayıp fonksiyonları aynı değil
  • bir büzülme yöntemi, daha iyi bir tahmin edicinin sonuçlandığı varyasyonu azaltmak için birine uygulanır
  • Soru : Başka bir deyişle, büzülme akıllıca uygulanırsa, daha verimli tahmin ediciler için her zaman daha iyi çalışır mı?

Temel olarak, bir tahmin ediciyi tarafsız tahminci sınıfı gibi belirli bir çerçevede geliştirmek mümkündür. Bununla birlikte, belirttiğiniz gibi, bir kayıp fonksiyonu kuadratik kaybı en aza indirirken diğeri entropiyi en aza indirdiğinden, farklı kayıp fonksiyonları durumu zorlaştırır. Dahası, "her zaman" kelimesini kullanmak çok zordur, çünkü eğer bir tahminci sınıfın en iyisi ise, mantıksal olarak konuşursak daha iyi bir tahmin edemezsiniz.

(Aynı çerçevede) basit bir örnek, iki tahmin edicileri, yani bir köprü (ceza ile regresyon izin normu cezası) ve sürükleyerek (NORM ceza olabilirlik) ve birtakım parametreler seyrek bir dizi β , bir lineer model y = x β + e , hata teriminin normallik, e ~ N ( 0 , σ 2 < ) , bilinen σ , ikinci dereceden kayıp fonksiyonu (en küçük kare hataları), ve değişkenlerin bağımsızlık x . P = 3 için l p'yi seçelimlpβy=xβ+eeN(0,σ2<)σxlpp=3birinci tahminci için ve ikinci tahminci için. Daha sonra , daha düşük varyansa sahip daha iyi bir tahminci olan p 1'i seçerek tahmincileri iyileştirebilirsiniz . Sonra bu örnekte tahminciyi geliştirme şansı vardır.p=2p1

Dolayısıyla, aynı tahmin ediciler ailesini ve aynı kayıp fonksiyonunu ve varsayımları varsayarsak, sorunuza cevabım evet.


p1p=3p=2p

lpl1

β^1β^2pα^jp=argminααβ^j22+λαpj{1,2}p=2,3

@Ben teşekkürler, büzülme tanımında fikir birliği olmadığını hissediyorum. Bunu bir post-process gibi kabul edersiniz, fakat benim için satır içi işlem olarak. Bence ikimiz de haklıyız çünkü soru büzülme türünü hesaba katmıyor. PS: Sanırım büzülmeden ne demek sert eşik gibi.
TPArrow

β^1β^2 β^1β^2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.