Bootstrap CI'lerin (ve bartikülerdeki BCa) normal olarak dağıtılan verilerde nasıl performans gösterdiğini merak ediyordum. Çeşitli dağıtım türlerindeki performanslarını inceleyen çok fazla iş var gibi görünüyor, ancak normal olarak dağıtılan veriler üzerinde hiçbir şey bulamadı. İlk önce çalışmak bariz bir şey gibi göründüğünden, sanırım kağıtlar çok eski.
R önyükleme paketini kullanarak bazı Monte Carlo simülasyonları yaptım ve küçük örnekler (N <20) için biraz liberal olma eğiliminde olmalarına rağmen, bootstrap CI'lerinin kesin CI'larla uyumlu olduğunu gördüm. Yeterince büyük örnekler için bunlar esasen aynıdır.
Bu, her zaman önyükleme kullanmamanın iyi bir nedeni olup olmadığını merak ediyor . Bir dağılımın normal olup olmadığını değerlendirmenin zorluğu ve bunun arkasındaki birçok tuzak göz önüne alındığında, dağıtımdan bağımsız olarak bootstrap CI'lere karar vermemek ve rapor etmemek makul görünmektedir. Parametrik olmayan testleri sistematik olarak kullanmama motivasyonunu anlıyorum, çünkü daha az güce sahipler, ancak simülasyonlarım bunun bootstrap CI'leri için geçerli olmadığını söylüyor. Daha da küçükler.
Beni rahatsız eden benzer bir soru, neden medyanı her zaman merkezi eğilimin ölçüsü olarak kullanmıyor. İnsanlar genellikle normal olarak dağıtılmayan verileri karakterize etmek için bunu kullanmanızı önerir, ancak medyan normal olarak dağıtılan verilerin ortalamasıyla aynı olduğundan, neden bir ayrım yapmalısınız? Bir dağılımın normal olup olmadığına karar verme prosedürlerinden kurtulabilmemiz oldukça yararlı görünecektir.
Bu konular hakkındaki düşüncelerinizi ve bunların daha önce tartışılıp tartışılmadığını çok merak ediyorum. Referanslar çok takdir edilecektir.
Teşekkürler!
Pierre