Bir istatistikçiye herhangi bir soru sorun ve cevapları bir çeşit "duruma bağlıdır" olacaktır.
O bağlıdır . Modelin türü (iyi nokta cbeleites!) Dışında, eğitim ayar noktalarının sayısı ve öngörücülerin sayısı? Model sınıflandırma içinse, büyük bir sınıf dengesizliği tekrar sayısını artırmama neden olur. Ayrıca, bir özellik seçme prosedürünü yeniden örneklersem, daha fazla örneğe yönelirim.
Bu bağlamda kullanılan herhangi bir yeniden örnekleme yöntemi için (klasik önyüklemenin aksine), dağılım ortalamasının "yeterince hassas" bir tahminini elde etmek için sadece yeterli yinelemelere ihtiyacınız olduğunu unutmayın. Bu özneldir ama herhangi bir cevap olacaktır.
Bir saniye boyunca iki sınıfla sınıflandırmaya bağlı kalmak, modelin doğruluğunun yaklaşık 0.80 olmasını beklediğinizi / umduğunuzu varsayalım. Yeniden örnekleme işlemi doğruluk tahminini örneklediğinden (örneğin p
), standart hata, örnek sayısının olduğu sqrt[p*(1-p)]/sqrt(B)
yerdir B
. Çünkü B = 10
, doğruluğun standart hatası yaklaşık 0.13'tür ve bununla B = 100
birlikte yaklaşık 0.04'tür. Bu formülü, bu özel durum için kabaca bir rehber olarak kullanabilirsiniz.
Ayrıca, bu örnekte, doğruluk varyansının 0,50'ye yaklaştıkça en üst düzeye çıkarıldığını, bu nedenle standart bir hatanın zayıf öğrenenler olan modellerden daha düşük olması gerektiğinden, doğru bir modelin daha az çoğaltma gerektirmesi gerektiğini düşünün.
HTH,
maksimum