Neden bir önyükleme dağılımının ortalamasını bildirmiyorsunuz?


30

Biri standart hatayı elde etmek için bir parametreyi patlattığında, parametrenin bir dağılımını elde ederiz. Neden bu dağılımın ortalamasını bir sonuç olarak kullanmıyoruz veya almaya çalıştığımız parametre için tahmin yapmıyoruz? Dağılım, gerçekte yaklaşık değil mi? Bu nedenle “gerçek” değer hakkında iyi bir tahminde bulunacağız. Yine de örneklemimizden aldığımız orijinal parametreyi rapor ediyoruz. Neden?

Teşekkürler

Yanıtlar:


24

Çünkü bootstrapped istatistiği sizin popülasyon parametrenizden bir soyut daha var. Nüfus parametreniz, örnek istatistikleriniz var ve yalnızca önyüklemenizin üçüncü katmanında. Önyükleme ortalama değeri, popülasyon parametreniz için daha iyi bir tahmin edici değildir. Bu sadece bir tahminin tahminidir.

Olarak hemen aynı koşullar altında popülasyon parametre çevresinde örnek istatistiği merkezleri gibi örnek istatistik çevresindeki tüm olası desteksiz kombinasyonları merkezleri içeren önyükleme dağılımı. Bu yazı, burada yukarı oldukça güzel bunları toplar ve bulabildiğim en kolay biri. Daha ayrıntılı ispatlar için referans aldıkları kağıtları takip edin. Kayda değer örnekler Efron (1979) ve Singh (1981) 'dir.n

Arasında desteksiz dağılımı dağılımını aşağıdaki güven aralıkları yapımında, örnek bir standart tahmin hatası tahmininde yararlı bir hale getirir, ve tahmininde hangi parametrenin önyargısı. Nüfus parametresi için daha iyi bir tahminci yapmaz. Sadece istatistiğin dağılımı için olağan parametrik dağılımlara daha iyi bir alternatif sunar.θBθ^θ^θ


13

İnsanlar en az bir durum vardır do torbalama (kısa: önyükleme ortalama dağılım kullanmak önyükleme toplayarak ).

Temel fikir, tahmin ediciniz verilerdeki bozulmalara karşı çok hassas ise (yani tahmin edicinin yüksek varyansı ve düşük önyargısı varsa), o zaman belirli örneklerin üstesinden gelme miktarını azaltmak için birçok önyükleme örneği üzerinde ortalama yapabilirsiniz.

Bağlantılı olduğum sayfa, bunun tahmininize bazı önyargıları getirdiğine işaret ediyor, bu nedenle örnek ortalamanın önyükleme örneklerinin ortalamasından daha anlamlı olacağı belirtiliyor. Ancak, verilerdeki küçük değişikliklere cevaben radikal olarak değişebilen bir karar ağacı veya en yakın komşu sınıflandırıcı gibi bir şeyiniz varsa, bu önyargı, fazla uydurma kadar büyük bir sorun olmayabilir.


1
Sorunu anladığımdan emin değilim. Aslında "bir parametrenin önyargısı" ifadesini kullanmadım . Tamamen emin derken ne demek istediğine de değilim karşı bu bağlamda. yθ
David J. Harris

Normalde kişinin cevap için tahminlerine ilişkin varyansı azaltmak için kullanılan torbalamayı görüyorum (örn. Verilerdeki dalgalanmalara duyarlılığı). En yaygın şekilde paketlenmiş modeller (örneğin ağaçlar) tipik olarak önyükleme örnekleri arasında kolayca karşılaştırılabilecek iyi tanımlanmış parametrelere sahip değildir.
David J. Harris

Teşekkürler, aynen öyle düşündüm. Bana göre torbalama, yanıtın tahmini dışında herhangi bir şey için pek mantıklı görünmüyor, bu nedenle bu anlamda sınırlıdır.
Momo

10

Bu bootstrap örneklerin ortalama farkı kayda değerdir ve örnek tahmini bazen önyargı bir tahmini olarak kullanılabilir gerçek parametre tahmin .θBθ^θ^θ

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.