Bootstrapping'in artıları ve eksileri


11

Önyükleme kavramını yeni öğrendim ve naif bir soru aklıma geldi: Verilerimizden her zaman çok sayıda bootstrap örneği oluşturabilirsek, neden daha fazla "gerçek" veri elde etmek için uğraşasınız?

Bir açıklamam olduğunu düşünüyorum, lütfen doğru olup olmadığımı söyle: Önyükleme işleminin varyansı azalttığını düşünüyorum, ancak orijinal veri kümem BIASED ise, düşük varyans ve yüksek önyargı ile sıkıştığımdan, kaç kopya olursa olsun Alıyorum.


4
bootstrapping , verilerde (ve modelde) olduğundan daha fazla bilgi oluşturmaz ... gerçek veriler size daha fazla bilgi verebilir
Glen_b -Restate Monica

2
Glen_b ile daha fazla bilgi yaratmadığına katılıyorum, ancak size daha az bilgi verebileceğini kabul etmiyorum. Cevabımda söylediğim gibi, her zaman iyi çalışmaz, ancak herhangi bir istatistiksel yöntemden söz edilebilir.
Michael R.Chernick

1
İlginç bir soru - belki de ilgili bir kavram, bootstrap neden çalışıyor? . Bunu anlamak, ne zaman yararlı olduğunu bilmenize yardımcı olacaktır. Bootstrap'i örnekleme dağılımları için normal yaklaşım üzerinde bir gelişme olarak düşündüm. Çok aşırı olmayan normallikten uzaklaşmaları ele alabilir. Diğer çekici özelliği, analitik / cebirsel çalışma yapmanıza gerek olmamasıdır - çoğaltma bunu sizin için yapar.
olasılık

Yanıtlar:


15

Bootstrap, popülasyon dağılımı için parametrik bir form almayı gerektirmeyen bir şekilde çıkarım yapma yöntemidir. Orijinal örneğe, orijinal örnekten değiştirme ile örnekleme yapılsalar bile popülasyonmuş gibi davranmaz. N boyutundaki orijinal numuneden değiştirilen örneklemenin, daha büyük bir popülasyondan n boyutundaki bir örneği alarak taklit ettiğini varsayar. Ayrıca, m <n'nin n boyutundaki bir örnekten m zamanını yeniden örnekleyen n bootstrap'in m gibi birçok varyantı vardır. Bootstrap'ın güzel özellikleri asimtotik teoriye bağlıdır. Diğerlerinin de belirttiği gibi, bootstrap popülasyon hakkında orijinal örnekte verilenlerden daha fazla bilgi içermez. Bu nedenle bazen küçük örneklerde iyi çalışmaz.

2007'de Wiley tarafından yayınlanan "Bootstrap Metodları: Bir Uygulayıcı Kılavuzu" ikinci kitabımda, bootstrap'in başarısız olabileceği durumlara dikkat çekiyorum. Bu, sonlu momentleri olmayan dağılımı, küçük numune boyutlarını, dağılımdan aşırı değerleri tahmin etmeyi ve popülasyon büyüklüğünün N olduğu ve büyük bir numune n'nin alındığı anket örneklemesinde varyansı tahmin etmeyi içerir. Bazı durumlarda, önyüklemenin varyantları orijinal yaklaşımdan daha iyi çalışabilir. Bu bazı uygulamalarda n önyükleme dışarı m ile olur Ayrımcı analizde hata oranlarının tahmin edilmesi durumunda, 632 önyükleme diğer önyükleme yöntemleri de dahil olmak üzere diğer yöntemlere göre bir gelişme.

Bunu kullanmanın bir nedeni, bazen parametrik varsayımlara güvenemezsiniz ve bazı durumlarda bootstrap diğer parametrik olmayan yöntemlerden daha iyi çalışır. Doğrusal olmayan regresyon, sınıflandırma, güven aralığı tahmini, yanlılık tahmini, p-değerlerinin ayarlanması ve zaman serisi analizi gibi çok çeşitli problemlere uygulanabilir.


6

Bir önyükleme örneği size yalnızca orijinal örnek hakkında bir şeyler söyleyebilir ve size gerçek nüfus hakkında yeni bir bilgi vermez. Güven aralıkları ve benzerlerini oluşturmak için parametrik olmayan bir yöntemdir.

Eğer popülasyon hakkında daha fazla bilgi edinmek istiyorsanız, popülasyondan daha fazla veri toplamanız gerekir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.