Neden her zaman bootstrap CI kullanmıyorsunuz?


12

Bootstrap CI'lerin (ve bartikülerdeki BCa) normal olarak dağıtılan verilerde nasıl performans gösterdiğini merak ediyordum. Çeşitli dağıtım türlerindeki performanslarını inceleyen çok fazla iş var gibi görünüyor, ancak normal olarak dağıtılan veriler üzerinde hiçbir şey bulamadı. İlk önce çalışmak bariz bir şey gibi göründüğünden, sanırım kağıtlar çok eski.

R önyükleme paketini kullanarak bazı Monte Carlo simülasyonları yaptım ve küçük örnekler (N <20) için biraz liberal olma eğiliminde olmalarına rağmen, bootstrap CI'lerinin kesin CI'larla uyumlu olduğunu gördüm. Yeterince büyük örnekler için bunlar esasen aynıdır.

Bu, her zaman önyükleme kullanmamanın iyi bir nedeni olup olmadığını merak ediyor . Bir dağılımın normal olup olmadığını değerlendirmenin zorluğu ve bunun arkasındaki birçok tuzak göz önüne alındığında, dağıtımdan bağımsız olarak bootstrap CI'lere karar vermemek ve rapor etmemek makul görünmektedir. Parametrik olmayan testleri sistematik olarak kullanmama motivasyonunu anlıyorum, çünkü daha az güce sahipler, ancak simülasyonlarım bunun bootstrap CI'leri için geçerli olmadığını söylüyor. Daha da küçükler.

Beni rahatsız eden benzer bir soru, neden medyanı her zaman merkezi eğilimin ölçüsü olarak kullanmıyor. İnsanlar genellikle normal olarak dağıtılmayan verileri karakterize etmek için bunu kullanmanızı önerir, ancak medyan normal olarak dağıtılan verilerin ortalamasıyla aynı olduğundan, neden bir ayrım yapmalısınız? Bir dağılımın normal olup olmadığına karar verme prosedürlerinden kurtulabilmemiz oldukça yararlı görünecektir.

Bu konular hakkındaki düşüncelerinizi ve bunların daha önce tartışılıp tartışılmadığını çok merak ediyorum. Referanslar çok takdir edilecektir.

Teşekkürler!

Pierre


Ortalama ve medyan ile ilgili sorumu burada bulabilirsiniz: stats.stackexchange.com/questions/96371/…
Alexis

Birçok problem için yeniden örnekleme hesaplanabilir değildir. Örneğin, büyük bir 3D matrisi veya uzun süre serisi için CI'leri hesaplamak istiyorsanız.
jona

Yanıtlar:


4

BCa aralığı için motivasyona ve mekanizmalarına (yani "düzeltme faktörleri") bakmak faydalıdır. BCa aralıkları, önyüklemenin en önemli yönlerinden biridir, çünkü Bootstrap Yüzdelik Aralıklarının daha genel durumudur (yani, yalnızca önyükleme dağılımının kendisine dayalı güven aralığı).

Özellikle, BCa aralıkları ve Bootstrap Yüzde Aralıkları arasındaki ilişkiye bakın: hızlanma (ilk "düzeltme faktörü") ve çarpıklık (ikinci "düzeltme faktörü") hem sıfır olduğunda, hem de BCa aralıkları geri döndüğünde tipik Bootstrap yüzdelik aralığı.

HER ZAMAN önyükleme kullanmanın iyi bir fikir olacağını düşünmüyorum. Bootstrapping, farklı mekanizmaları (örn: normallik olmayan) ayarlamak için çeşitli mekanizmalara sahip (örn: güven aralıkları ve dayanıklılık olduğunda vahşi bootstrap gibi farklı sorun türleri için farklı bootstrap varyasyonları) güçlü bir tekniktir (örn: normallik olmaması) ), ancak önemli bir varsayım üzerine kuruludur: veriler gerçek nüfusu doğru bir şekilde temsil eder.

Bu varsayım, doğada basit olmasına rağmen, özellikle küçük örnek boyutları bağlamında doğrulanması zor olabilir (küçük bir örnek gerçek popülasyonun doğru bir yansıması olsa da!). Önyükleme dağılımının (ve dolayısıyla bundan sonraki tüm sonuçların) bulunduğu orijinal örnek yeterince doğru değilse, sonuçlarınız (ve dolayısıyla bu sonuçlara dayalı kararınız) kusurlu olacaktır.

SONUÇ: Bootstrap ile ilgili çok fazla belirsizlik var ve uygulamadan önce dikkatli olmalısınız.


2
"Önyükleme dağıtımının (ve dolayısıyla bundan sonraki tüm sonuçların) bulunduğu orijinal örnek yeterince doğru değilse, sonuçlarınız (ve dolayısıyla bu sonuçlara dayalı kararınız) hatalı olacaktır." -> ancak bootstrap CI bu durumlarda analitik alternatiften daha kötü performans gösteriyor mu?
jona

3
Verilerin popülasyonu yeterli şekilde temsil ettiği varsayımı sadece önyükleme için özel değildir: genel olarak istatistiklerle ilgilidir, bu nedenle veriler yetersizse yapılan herhangi bir çıkarım, önyükleme çıkarımları veya başka türlü yanıltıcıdır (yanlış bir varsayım Sonuç!).
mmmmmmmmmm

4
Dolayısıyla bu uyarı bootstrap'a değil, çıkarımla ilgilidir ve bootstrap'ı başka bir yöntem üzerinde kullanmaya karşı değil, yanlış yöntemlere mutlak inancı koymakla ilgili bir argümandır. O zaman bu bağlamda ne kadar alakalı olduğunu görmüyorum.
jona

Üzgünüz, bu iş parçacığında biraz geç .... @ jona: önyükleme örneği daha da artıracak çünkü bu ilgili olmaz mı? Örneğin örneğiniz popülasyonun talihsiz bir şekilde yanlış temsil edilmesi durumunda, bootstrapping kullanmak sizi nüfus merkezinden daha da uzağa gönderir mi? Bu sistematik olarak önyüklemeye güvenmeye karşı potansiyel bir argüman değil mi?
sisdog
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.