Önyükleme yöntemi. Rastgele alt örnekleme yerine neden “yedekli” örneklemelisiniz?


11

Bootstrap yöntemi son yıllarda büyük bir difüzyon gördü, ben de çok kullanıyorum, özellikle arkasındaki mantık oldukça sezgisel.

Ama bu anlamadığım bir şey. Efron neden tek gözlemleri rasgele dahil ederek veya hariç tutarak basitçe alt örnekleme yerine yenisiyle yeniden örnekleme yapmayı seçti?

Rastgele alt örneklemenin çok iyi bir kaliteye sahip olduğunu düşünüyorum, yani çalışmamızda gözlemlerimizin varsayımsal bir nüfusun bir alt kümesi olduğu gerçek yaşam durumunu temsil eder. Yeniden örnekleme sırasında gözlemleri çoğaltmanın avantajını görmüyorum. Gerçek bir bağlamda, özellikle karmaşık çok değişkenli durumlar için hiçbir gözlem diğerine benzemez.


3
yeniden örnekleme ile yeniden örnekleme yapılır çünkü model göz önüne alındığında yapılacak doğru şey budur. Önyüklemenin arkasındaki model, kümülatif dağılım işlevini tahmin etmek için parametrik olmayan maksimum olasılık kullanmak, daha sonra tahmini kümülatif dağılım işlevinden bağımsız gözlemleri örneklemektir. Bir düşünün --- algoritmik olarak, orijinal örnekten değiştirilerek örnekleme yoluyla elde edilir.
kjetil b halvorsen

Yanıtlar:


10

Bu seçimi anlamanın bir yolu, eldeki örneği temel popülasyonda sahip olduğunuz en iyi temsil olarak düşünmektir. Artık nüfusun tamamını örnekleyemeyebilirsiniz, ancak nüfusun bu özel temsiline sahipsiniz. Popülasyonun bu temsilinden gerçekten rastgele bir yeniden örnekleme, değiştirme ile örneklemeniz gerektiği anlamına gelir, aksi takdirde daha sonraki örneklemeniz ilk örneklemenizin sonuçlarına bağlı olacaktır. Belirli bir önyükleme örneğinde tekrarlanan bir vakanın varlığı, o belirli tekrarlanan vakanın özelliklerine yakın olan temel popülasyonun üyelerini temsil eder. Biri dışarıda bırakma veya birkaç dışarıda bırakma yaklaşımları da önerdiğiniz gibi kullanılabilir, ancak bu önyükleme yerine çapraz doğrulamadır.

Bence bu hemen hemen başka bir kelimeye @kjetil_b_halvorsen gelen yorum koyar


Konuyu anlıyorum. Bir bootstrap örneğinde birbirinden bağımsız gözlemlerin yapılması. Literatürde alt örneklemeye dayalı yöntemler mevcuttur, bakınız Politis, Romano, Wolf. Değiştirilmeden seçilen n n sabit alt kümesi m kullanılır. Daha önce söylediğin tuzaklardan nasıl kaçınırlar? Onların durumunda yine neden rastgele alt örnek yerine sabit boyutlu alt örnek kullandıklarını anlamıyorum.
Bakaburg

2
Alt örnekleme yöntemleri, önyüklemeden farklı bir şey yapmaya çalışıyor. Bu yöntemler , temel popülasyondan yeni bir rastgele örnek taklit etmeye çalışmak yerine veri örneğinden rastgele altkümeler seçmeye çalışmaktadır . Biri ya da diğeri yanlış değil; belirli güçlü ve zayıf yanları olan farklı yaklaşımlardır.
EdM

Belki de çıkarım istatistiklerinde iki yöntem arasındaki farkla ilgili yeni bir soru sormalıyım. Teşekkürler!
Bakaburg

@Bakaburg , önyükleme ile çapraz doğrulamaya (belirli bir alt örnekleme türü) ilişkin literatüre mükemmel bir giriş için bu soruya bakın .
EdM

@Bakaburg Önyükleme yöntemi, daha büyük bir popülasyondan n boyutlu (n'den küçük bir alt küme değil) rastgele örneklerin tekrarlanan bağımsız çizimini simüle etmektir. Bu, rastgele bir numunenin, ana popülasyondan genellikle orijinal örneğimizde yetersiz temsil edilen çok sayıda aşırı küçük veya büyük değer içerebileceği düşünülebilir. EdM'nin işaret ettiği gibi, w / replasman örneklemesi tek bir numune gözleminin popülasyonda benzer değerlere sahip çoklu gözlemleri "temsil etmesine" izin verir - bu, popülasyon dağılımının düzgün bir yaklaşımını elde etmenin bir yoludur.
RobertF
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.