Çizerek bir gerçekleştirir sözde parametrik olmayan önyükleme varsayalım boyutu örnekleri , n orijinal her n yerine gözlemler. Bu yordamın ampirik cdf tarafından kümülatif dağılım işlevini tahmin etmeye eşdeğer olduğuna inanıyorum:
http://en.wikipedia.org/wiki/Empirical_distribution_function
ve daha sonra arka arkaya tahmini cdf B sürelerinden gözlemleri simüle ederek bootstrap örneklerinin elde edilmesi .
Eğer bu konuda haklıysam, ampirik cdf yaklaşık N parametrelerine sahip olduğu için aşırı takma sorununu ele almak gerekir. Tabii ki, asimptotik olarak popülasyon cdf'ye yakınsar, ama sonlu örnekler ne olacak? Örneğin, size 100 gözlemim olduğunu söylesem ve cdf'yi iki parametreyle olarak tahmin edersem, telaşa kapılmayacaksınız. Ancak, parametre sayısı 100'e kadar çıksaydı, hiç de makul görünmüyordu.
Benzer şekilde, standart bir çoklu doğrusal regresyon kullanıldığında, hata teriminin dağılımı olarak tahmin edilir . Kalıntıların önyüklemesine geçmeye karar verirse, şimdi sadece hata terimi dağılımını işlemek için kullanılan yaklaşık n parametre olduğunu fark etmelidir .
Beni bu konuyu açıkça ele alan bazı kaynaklara yönlendirebilir misiniz, yoksa yanlış yaptığımı düşünüyorsanız neden sorun olmadığını söyleyebilir misiniz?