Ben de hem bootstrapping hem de Bayes teoremi tarafından baştan çıkarıldım, ancak Bayes bakış açısıyla bakana kadar bootstrapping'in gerekçelerini tam olarak anlayamadım. O zaman - aşağıda açıkladığım gibi - önyükleme dağılımı, önyükleme işleminin arkasındaki (a?) Mantığını belirgin hale getiren ve aynı zamanda yapılan varsayımları netleştirme avantajına sahip olan Bayesçi bir arka dağılım olarak görülebilir. Aşağıdaki argümanın ve yapılan varsayımların daha fazla detayı https://arxiv.org/abs/1803.06214 (sayfa 22-26) 'da verilmiştir.
Örnek olarak, http://woodm.myweb.port.ac.uk/SL/resample.xlsx adresinde e-tabloda ayarlanan bir örnek olarak (ekranın altındaki önyükleme sekmesini tıklayın) ortalama 60 değerinde 9 ölçüm örneği. E-tabloyu bu örnekten değiştirilen 1000 örnek üretmek için kullandığımda ve araçları en yakın eşit sayıya yuvarladığımda, bu araçların 82'si 54 idi. 9'un örneklerinin ortalamalarının ne kadar değişken olabileceğini görmek için örneği bir "taklit" popülasyonu olarak kullanmak, bu nedenle bir örnek ortalamanın popülasyon ortalamasının altında 6 olması olasılığını ortaya koymaktadır (bu durumda taklit popülasyonu, ortalama 60 olan örnek)% 8.2'dir. Ve yeniden örnekleme histogramındaki diğer çubuklar hakkında da benzer bir sonuca varırız.
Şimdi, hakikatin gerçek popülasyonun ortalamasının 66 olduğunu hayal edelim. Eğer öyleyse, örnek ortalamanın 60 (yani Veri) olduğu ihtimaline dair tahminimiz% 8,2 (yukarıdaki paragraftaki sonucu kullanarak) bu 60, varsayılmış nüfus ortalamasının 66 altında 6 dır). Bunu şöyle yazalım
P (Veriler Ortalama = 66) =% 8,2
ve bu olasılık, yeniden örnekleme dağılımındaki 54 x değerine tekabül eder. Aynı argüman her 0, 2, 4 ... 100 ortalamaları için geçerlidir. Her durumda olasılık yeniden örnekleme dağılımından gelir - ancak bu dağılım 60'ın ortalamasına yansır.
Şimdi Bayes teoremini uygulayalım. Söz konusu ölçüm sadece 0 ile 100 arasında bir değer alabilmektedir, bu yüzden en yakın çift sayıya yuvarlama popülasyon ortalaması için olasılıklar 0, 2, 4, 6, .... 100'dür. Eğer önceki dağılımın düz olduğunu varsayarsak, bunların her birinin% 2 (1 dp'ye kadar) önceliği vardır ve Bayes teoremi bize şunu söyler:
P (PopMean = Verilmiş 66 veri) =% 8,2 *% 2 / P (Veri)
nerede
P (Veri) = P (PopMean = 0 Verilmiş Veriler) *% 2 + P (PopMean = 2 Verilmiş Veriler) *% 2 + ... + P (PopMean = 100 Veriler Verilmiş) *% 2
Şimdi% 2'yi iptal edebiliriz ve olasılıkların yeniden örnekleme dağılımından gelenler olduğundan, olasılıkların toplamının 1 olması gerektiğini hatırlayabiliriz. Bu bizi sonuçlandırıyor
P (PopMean = 66)% 8.2 =
% 8,2'nin 54'e (66 yerine) karşılık gelen yeniden örnekleme dağılımındaki olasılık olduğunu hatırlatarak, posterior dağılım basitçe örnek ortalamasına yansıyan yeniden örnekleme dağılımıdır (60). Ayrıca, yeniden örnekleme dağılımı asimetrilerin rastgele olduğu simetrikse - bu ve diğer birçok durumda olduğu gibi, yeniden örnekleme dağılımını posterior olasılık dağılımına özdeş olarak alabiliriz.
Bu argüman çeşitli varsayımlarda bulunur, asıl olan önceki dağıtımın tek tip olmasıdır. Bunlar, yukarıda belirtilen makalede daha ayrıntılı olarak yazılmıştır.