Yanıt tahmin çiftleri bir popülasyondan rastgele örnekle elde edilmişse, case / random-x / ilk yeniden örnekleme şemasını kullanmak güvenlidir. Öngörücüler için kontrol edilmişse veya öngörücülerin değerleri deneyci tarafından belirlenmişse, artık / model tabanlı / sabit-x / ikinci yeniden örnekleme şemasını kullanmayı düşünebilirsiniz.
İkisi nasıl farklı? Davison ve Kounen tarafından R'deki uygulamalarla bootstrap'a giriş, bu soru ile ilgili bir tartışmaya sahiptir (bkz. S.9). Ayrıca John Fox'un bu ekindeki R koduna bakın, özellikle rasgele-x şeması için p.5 üzerinde boot.huber ve sabit-x şeması için p.10'da boot.huber.fix işlevlerini görür. İken Shalizi tarafından ders notları iki şemaları farklı veri kümeleri / problemlere uygulanır, Fox'un apandis iki şemaları sık sık yapabilir ne kadar az fark göstermektedir.
İkisinin ne zaman aynı sonuçları vermesi beklenebilir? Bir durum, regresyon modelinin doğru bir şekilde belirtilmesidir, örneğin, değiştirilmemiş doğrusal olmayanlık yoktur ve olağan regresyon varsayımları (örneğin, iid hataları, aykırı değerler yok) karşılanır. Bkz . Fox'un kitabında (R kodu ile yukarıda belirtilen ekin dolaylı olarak ait olduğu) 21. bölüm , özellikle 598. sayfadaki tartışma ve alıştırma 21.3. "Regresyonda rastgele ve sabit yeniden örnekleme" başlıklı. Kitaptan alıntı yapmak
By randomly reattaching resampled residuals to fitted values, the [fixed-x/model-based]
procedure implicitly assumes that the errors are identically distributed. If, for
example, the true errors have non-constant variance, then this property will not be
reflected in the resampled residuals. Likewise, the unique impact of a high-leverage
outlier will be lost to the resampling.
Bu tartışmadan, fixed-x bootstrap'in neden modelin fonksiyonel formunun doğru olduğunu varsaydığını (hata dağılımının şekli hakkında herhangi bir varsayım yapılmamasına rağmen) öğreneceksiniz.
Derek Bain tarafından hazırlanan İrlanda Aktüerler Topluluğu için bu konuşmanın 12. bölümüne bakınız . Ayrıca neyin "aynı sonuç" olarak değerlendirilmesi gerektiği konusunda bir örneği vardır:
The approach of re-sampling cases to generate pseudo data is the more usual form of
bootstrapping. The approach is robust in that if an incorrect model is fitted an
appropriate measure of parameter meter uncertainty is still obtained. However re
sampling residuals is more efficient if the correct model has been fitted.
The graphs shows both approaches in estimating the variance of a 26 point data sample
mean and a 52 point sample mean. In the larger sample the two approaches are
equivalent.