Tutarsız tahminciler hiç tercih edilir mi?


22

Tutarlılık açıkça doğal ve önemli bir özellik tahmincisidir, ancak tutarlı bir tahmin yerine tutarsız bir tahmin edici kullanmanın daha iyi olabileceği durumlar var mı?

Daha özel olarak ise, bütün sonlu için makul bir tutarlı tahmincisi geride tutarsız tahmin edicinin orada örnekleridir (bazı uygun kayıp fonksiyonu ile ilgili olarak)?n


1
Model seçiminin tutarlılığı ile kement ve (birçok!) Varyantlarını kullanarak tahmin problemlerinde parametre tutarlılığı arasında performansta ilginç bir denge vardır. Bu, örneğin Bühlmann ve van der Geer'in son metinde detaylı olarak verilmiştir.
kardinal

Şimdi silinen benim cevabımdaki tartışma hala geçerli olmaz mıydı? Yani: küçük numunelerde düşük değişkenliğe sahip yansız bir tahmin ediciye sahip olmak daha iyidir. Ya da tutarlı bir tahmin edicinin her zaman başka bir tarafsız tahmin ediciden daha düşük varyansı olduğunu gösterebilir mi?
Bob Jansen

Belki de, @Botvis! MSE değeri düşük olan tutarsız bir tahminci örneğiniz var mı?
MånsT

3
@Bootvis: Tutarlılık ve tarafsızlık hakkında soru soran son bir sorunun cevabı üzerine yapılan kapsamlı yorumlara bakarsanız, tutarlı bir tahmincinin hem sapma hem de önyargı üzerinde keyfi bir şekilde vahşi davranışa sahip olabileceğini göreceksiniz (hatta, aynı anda!) . Bu, yorumunuzla ilgili tüm şüpheleri ortadan kaldırmalıdır.
kardinal

İki kitaptan birinin olduğunu sanıyordum ama görünüşe göre bu konuda da yanılmışım! Örnek bulunacak bir yer değil. @ cardinal: Sesler ilginç, kontrol edecek
Bob Jansen

Yanıtlar:


25

Bu cevap, tutarsız bir tahmin edici tarafından doğal bir tutarlı tahmin edicinin hakim olduğu (tüm örneklem büyüklükleri için tüm olası parametre değerlerinden daha iyi performans gösterdiği) gerçekçi bir sorunu açıklar. Tutarlılığın ikinci dereceli kayıplar için en uygun olduğu fikriyle motive edilir, bu nedenle kuvvetli bir şekilde ayrılan bir zararı kullanmak (asimetrik bir kayıp gibi) tahmin edicilerin performansını değerlendirmede tutarlılığı neredeyse işe yaramaz hale getirmelidir.


Müşterinizin bir iid örneğinden bir değişkenin (simetrik bir dağılıma sahip olduğu varsayılır) ortalamasını tahmin etmek istediğini varsayalım , ancak bunların (a) ya da (b) aşırı derecede aşırı tahmin etmekten çekindiklerini o.(x1,,xn)

Bunun nasıl işe yarayabileceğini görmek için, basit bir kayıp işlevini benimseyelim, pratikte kaybın bu durumdan nicel olarak (ancak niteliksel olarak değil) farklı olabileceğini anlayın. Böylece ölçüleri seçin büyük tolere abartılıdır, ve bir tahmin kaybını ayarlamak t gerçek ortalama olduğunda μ eşit 0 zaman μ t μ + 1 ve eşit 11tμ0μtμ+11 aksi.

Hesaplamalar, ortalama ve varyans σ 2 > 0 olan bir Normal dağılım ailesi için özellikle basittir , o zaman numune ortalaması ˉ x = 1'dir.μσ2>0Normal(μ,σ2/n)dağılımına sahiptir. Örnek ortalama,iyi bilinen (ve açık) olduğu gibiμtutarlı bir tahmincisidir. Yazmacpstandart normal CDF için, örneklem ortalamasının beklenen kaybı eşittir1/2+j(-x¯=1nΣbenxben(μ,σ2/n)μΦ:1/2örnek ortalaması gerçek ortalama ve hafife ki% 50 olasılıkla gelencp(-1/2+Φ(-n/σ)1/2, gerçek ortalamayı1'denfazla fazla tahmin etme şansından gelir.Φ(-n/σ)1

Zararlar

Beklenen kaybı, bu standart normal PDF altındaki mavi alana eşittir. Kırmızı alan aşağıdaki alternatif tahmin edicinin beklenen kaybını veriyor. Sabit mavi alanı - √ ile değiştirerek farklılık gösterirler.x¯ve0arasında daha küçük bir kırmızı katı alanı tarafından-n/(2σ)0ven/(2σ). Bu farknarttıkçabüyür.n/σn

Tarafından verilen alternatif bir tahmin beklenen kaybına sahiptir 2 cp ( - x¯+1/2. Normal dağılımların simetrisi ve tekdüzelliği, beklenen kaybının her zaman örnek ortalamasından daha iyi olduğu anlamına gelir. (Bu örnek, ortalama halekabul edilemezbu kaybı). Gerçekten de, örnek ortalaması beklenen zarar bir alt sınıra sahiptir1/2'yealternatif yakınsak bu ise0olarakNbüyür. Bununla birlikte, alternatif açık tutarsız: olarak, nbüyür, bu olasılık yakınsarμ+1/2^ ı.2Φ(-n/(2σ))1/20nnμ+1/2μ

Kayıp fonksiyonları

x¯x¯+1/2n


2
L2L2

5
@Macro Düşünme bir şekilde dolaylıdır ve katı olmaya yönelik değildir, ancak doğal olduğuna inanıyorum: ikinci dereceden bir kayıp (Chebyshev aracılığıyla) olasılıkta yakınsamaya neden olan varyansı en aza indirir. Bu nedenle, bir karşı örnek bulmak için bir sezgisel, bu tür manipülasyonların başarısız olduğu kadar ikinci dereceden kayıplara odaklanmalıdır.
whuber

1
1/20n

3
@Michael OK, bunu açıkladığınız için teşekkürler. Bu bağlamda, kuadratik olmayan bir kayba sahip bir "avantaj", önyargı şartları olarak ifade edilmez. Birisi bu kayıp işlevini eleştirebilir, ancak bunu tamamen reddetmek istemiyorum: Örneğin, verilerin belirli toleranslara göre üretilmiş bir öğenin ölçümleri olduğu ve felaket olacağı durumları modelliyor (Shuttle o-ring başarısızlığında olduğu gibi) veya iflasın felaketi) gerçek anlamda bu toleransların dışına düşmek.
whuber

1
(+1) Harika cevap, @whuber! Özellikle fazla patolojik hissetmemesini seviyorum - bu tür bir kaybın uygulanabileceği birçok durum düşünebiliyorum.
MånsT
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.