Bootstrap örneklerinin boyutu


9

Örnek istatistiğin varyansını tahmin etmenin bir yolu olarak önyüklemeyi öğreniyorum. Temel bir şüphem var.

Http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf adresinden alıntı :

• Kaç gözlemi tekrar örneklemeliyiz? İyi bir öneri orijinal numune boyutudur.

Orijinal örnekteki kadar gözlemi nasıl yeniden örnekleyebiliriz?
100 örnek büyüklüğüm varsa ve ortalamanın varyansını tahmin etmeye çalışıyorum. Toplam 100 numune büyüklüğünden 100 büyüklüğünde çoklu bootstrap örneklerini nasıl alabilirim ? Bu durumda sadece 1 bootstrap örneği mümkün olacaktı, bu orijinal örneğe eşit olacaktı değil mi?

Açıkçası çok temel bir şeyi yanlış anlıyorum. Anlıyorum sayı arasında ideal bir önyükleme örneklerinin her zaman sonsuzdur ve akılda benim gerekli hassasiyet tutmak ben yakınlaşma için teste olurdu benim veriler için gerekli önyükleme örneklerinin sayısını belirlemek için.
Ancak her bir bootstrap örneğinin boyutu ne olması gerektiği konusunda gerçekten kafam karıştı .


7
S. Şekil 3 ve buradaki resimler, yeniden örneklemenin yerine
whuber

Ancak bootstrap örnek boyutum, sahip olduğum toplam gözlem sayısıyla aynı ise, neyle değiştiririm?
user1265125

Basitleştirilmiş örnek - örnek kümem olarak 4,1,3,7,5 varsa. 5 boyutlu birden çok bootstrap örneğini nasıl oluşturabilirim? Tek boyutlu 5 bootstrap örneği 4,1,3,7,5 yani orijinal numune seti olacaktır.
user1265125 18:16

1
Oh bekleyin anladım - "• Bir örnekleme dağılımını simüle etmek için, sadece numunenin birçok kopyasından oluşan bu" popülasyon "dan tekrarlanan rastgele örnekler alabiliriz"
user1265125 18:16

Yanıtlar:


16

Bootstrap, değiştirilerek numune alınarak gerçekleştirilir . Görünüşe göre "yedekli" terimi sizin için belirsiz. Whuber tarafından belirtildiği gibi, sübstitüsyon ile örneklemenin gösterimi s. Belirttiğiniz kağıdın 3'ü (aşağıda çoğaltılmıştır).

Değiştirme ile örnekleme çizimi

(kaynak: http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf )

Değiştirme ile örneklemenin genel fikri, herhangi bir vakanın birden çok kez örneklenebileceğidir (yukarıdaki ilk görüntüde yeşil mermer; son resimde mavi ve mor mermerler). Kendinizi bu süreci hayal etmek istiyorsanız, renkli mermerler ile dolu bir kase düşünün. Diyelim ki bu kaseden bir miktar mermer çizmek istiyorsun. Eğer örneklenmiş Eğer olmadan değiştirilmesi, o zaman sadece kase dışarı mermerler alıp kenara örneklenmiş olanları koyarak olacaktır. Eğer örneklenmiş Eğer ile değiştirilmesi, o zaman defterine 's renge aşağı imzalanması, çanağın tek mermeri alarak, tek-birer mermer örnekleme ve ardından olurdu geri dönenkaseye. Bu nedenle, değiştirmeyle örnekleme yaparken aynı mermer birden fazla kez örneklenebilir.

Örnekleme Yani olmadan değiştirilmesi, sadece tadabilirsiniz içeren kase dışına mermerler örnekleme durumunda iken, mermerler ile değiştirilmesi Eğer mermerler (daha büyük sonra herhangi bir sayıda tadabilirsiniz sonlu nüfustan). Eğer örneklenmiş Eğer dışarı mermerler olmadan değiştirilmesi tamamen aynı örnek ile ancak karışık sıra sona ereceğini. Örneklenmiş halinde üzerinden mermer ile değiştirilmesi, her zaman mümkün mermer farklı bir kombinasyon örnek olabilir.nnnnnnn

Orada örnekleme yollarını olmadan yedek boyutunun nüfusun dışarı durumlarda ve örnekleme yollarını ile değiştirilmesi. Arkasındaki matematik hakkında daha fazla okumak istiyorsanız, 2.1'i kontrol edebilirsiniz . Hossein Pishro-Nik tarafından hazırlanan Olasılığa Giriş online el kitabının Kombinatorik bölümü . WolframMathWorld sayfasında kullanışlı bir hile sayfası da var.(nk)kn(n+k1k)


0

Kaç gözlemi tekrar örneklemeliyiz? İyi bir öneri orijinal numune boyutudur.

Orijinal örnek boyutu çok büyük olduğunda ve tam veri kümesinde bir modeli eğitmek istemiyorsanız / eğitemiyorsanız, "iyi öneri" o kadar iyi değildir.

Not: Bunu soruya yorum olarak eklemek istedim ama yorum eklememe izin verilmiyor ...


1
Bu öneriyi neden eklemek istiyorsunuz? Bu, düzenli hesaplama çabaları için çok büyük veri kümelerinden kaynaklanıyorsa, bu ilgili bir pratik sorundur, ancak burada sorgulanan önyükleme teorisi için gerçekten geçerli değildir. Dahası, bu 'örnek bir istatistiğin varyansını tahmin etmek' üzerineydi. Bu gerçekten bir modelin eğitimi ile ilgili mi? (Not: kaba olmamak, henüz yorum gönderemediğini anlıyorum, ancak bu, yayınlarken ilgili bir cevap vermekten alıkoymuyor. Çok daha açık olmalısın, VEYA kendi sorunuzu göndermelisiniz)
IWS
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.