Bootstrap ve permütasyon hipotez testleri


37

Uygulamada sıklıkla kullanılan, önyükleme, permütasyon testi, jackknife, vb. Gibi pek çok popüler yeniden örnekleme tekniği vardır. Bu teknikleri tartışan çok sayıda makale ve kitap vardır, örneğin Philip I Good (2010) Permütasyon, Parametrik ve Bootstrap Testleri Hipotezler

Sorum şu ki, hangi yeniden örnekleme tekniği daha popüler ve daha kolay bir şekilde uygulandı? Önyükleme veya permütasyon testleri?


8
Popülerlik pek iyi bir kalite ölçütü değildir. Alıntılara (müşteri) bakıldığında, McDonalds herhangi bir üç yıldızlı Michelin kuruluşundan çok daha popüler (daha iyi?) Bir restoran. Bir sonraki seminer konuşmacını McDonalds'a götürür müsün?
StasK,

Yanıtlar:


68

Her ikisi de popüler ve faydalıdır, ancak öncelikle farklı kullanımlar için. Permütasyon testi, hipotezleri test etmek için en iyisidir ve ön yükleme, güven aralıklarını tahmin etmek için en iyisidir.

Permütasyon testleri, değişebilirliğin spesifik bir boş hipotezini test eder, yani yalnızca rastgele örnekleme / randomizasyon, görülen farkı açıklar. Bu, t testleri ve ANOVA gibi şeyler için yaygın bir durumdur. Ayrıca zaman serileri (seri korelasyonun olmadığı hipotezi) veya regresyon (ilişkisizliğin sıfır hipotezi) gibi şeylere de genişletilebilir. Permütasyon testleri güven aralıkları oluşturmak için kullanılabilir, ancak makul olabilecek veya olmayabilecek birçok varsayım gerektirir (bu nedenle diğer yöntemler tercih edilir). Mann-Whitney / Wilcoxon testi aslında bir permütasyon testi için özel bir durumdur, bu yüzden bazılarının farkında olduğundan çok daha popülerdir.

Önyükleme, örnekleme sürecinin değişkenliğini tahmin eder ve güven aralıklarını tahmin etmek için iyi çalışır. Bu şekilde bir hipotez testi yapabilirsiniz ancak permütasyon testi varsayımlarının tuttuğu durumlar için permütasyon testinden daha az güçlü olma eğilimindedir.


2
Cevap için teşekkürler. Önyükleme güven aralığı neden permütasyon testinden daha az güçlü? Ne kadar? Kişi, önemli ölçüde daha az güçlü olduğu durumları karakterize edebilir mi? Güven aralığını gösterebilmek bir avantaj gibi görünüyor, bu nedenle önyükleme daha değerli görünüyor.
dfrankow

2
@ dfrankow, 2 yöntem farklı varsayımlar kullanır. Büyük numuneler ve farklılıklar için her ikisi de iyi olacak, fakat daha küçük numuneler / farklılıklar ile permütasyon testinin farklılıklar bulması ve uygun olması daha muhtemeldir. Bu cevaba bakınız: stats.stackexchange.com/questions/112147/… , önyüklemenin doğru bir şekilde boyutlandırılmadığı örnekler için (boş değer doğru olduğunda çok sık reddeder).
Greg Snow,

Bir permütasyon testi açılışta bir değişiklik değil mi?
Vicki B

@VickiB, Önyükleme ve Permütasyon testleri sık sık birlikte belirtilir, ancak numuneleri değiştirme ve permütasyon numuneleri ile değiştirmeden değiştirme, bunlar ne yapabilecekleri ve ne kadar güçlü oldukları konusunda fark yaratır.
Greg Snow,


8

Sorum şu ki, hangi yeniden örnekleme tekniği daha popüler
Bootstrapping veya permütasyon testleri kazanmıştır ?

  1. Önyükleme, çoğunlukla büyük örnek standart hatalar veya güven aralıkları oluşturmakla ilgilidir; Adından da anlaşılacağı gibi permütasyon testleri çoğunlukla test ile ilgilidir. (Her biri olsa diğer görev için kullanılmak üzere uyarlanabilir.)

  2. Popülerliği nasıl değerlendiririz? Eğer psikoloji ve eğitim gibi alanlara bakarsak, Wilcoxon-Mann-Whitney, imzalı rütbe testi, rütbe-korelasyon testleri vb. Bunların hepsi permütasyon testleridir (diğer yandan, orijinal verilerin permütasyon testlerinin yerine kullanılabileceği ancak genellikle kullanılmadığı birçok durum vardır). Diğer bazı uygulama alanlarında, permütasyon testleri nadiren kullanılırdı, ancak uygulama alanları arasında değişen popülerlik bazen yararlılıktan çok hangi bölgenin yerel kültürü hakkında daha fazla şey söylüyor.

uygulanması daha kolay mı?

Çoğu durumda - özellikle basit olanlar - neredeyse tamamen eşit derecede kolaydır - aslında değiştirme ile örnekleme ve değiştirme olmadan örnekleme arasındaki fark budur.

Daha karmaşık durumların bazılarında, önyükleme yapmak daha kolaydır, çünkü (test bakış açısından incelendiğinde), sıfırdan ziyade alternatif altında çalışır (en azından naif uygulamalar olacak - iyi çalışması için çok daha karmaşık olabilir).

Kesin permütasyon testleri daha karmaşık durumlarda zor olabilir, çünkü uygun bir değiştirilebilir miktar gözlemlenemez olabilir - genellikle hemen hemen değiştirilebilir bir miktar tamlık fiyatına (ve gerçekten dağıtımsız olmak üzere) ikame edilebilir.

Önyükleme temelde başlangıçtan itibaren ilgili kesinlik kriterinden (aralıkların tam kapsamı) vazgeçer ve bunun yerine büyük numunelerde (bazen anlaşıldığından daha az başarılı olan; kontrol edilmediyse, kontrol edilemezseniz, bootstrap'inizin beklediğiniz kapsama alanı sağladığını varsaymayın).

Permütasyon testleri küçük numuneler üzerinde çalışabilir (sınırlı seviye seçimi, bazen çok küçük numunelerde sorun olabilir), bootstrap ise büyük bir örnek tekniğidir (küçük numunelerle kullanıyorsanız, çoğu durumda sonuçlar çok yararlı olun).

Onları nadiren aynı problem üzerinde rakip olarak görüyorum ve onları (farklı) gerçek problemlerde kullandım - genellikle bakılacak doğal bir seçim olacaktır.

Her ikisinin de yararları var, ancak ikisi de panakayada değil. Yalnızca bunlardan birine odaklanarak öğrenme çabalarını azaltmayı umuyorsanız, hayal kırıklığına uğrama olasılığınız çok yüksektir - her ikisi de yeniden örnekleme araç kutusunun temel parçalarıdır.


1
" Uygun bir değiştirilebilir miktarın gözlemlenemez olabileceğini " ne anlama geldiğini açıklayabilir misiniz ? (+1 açıkçası)
us11112

1
İki faktör ve bir eş değişkenli bir deneyde permütasyon testi yapmaya çalışmayı düşünün (veya sadece birkaç öngörücü içeren bir regresyon düşünün). Bağımsızlık ve hiç bir etkisi olmayan, gözlemler değişebilir ve bu nedenle bu hipotezi test edebilirsiniz, ancak sadece faktörlerin etki göstermesini beklediğinizden beri sadece faktörlerin permütasyon testini oluşturmak için bir yolunuz yoktur. ve null olduğunu test etmek ilginç değildir); Benzer şekilde, iki faktörden sadece birinin permütasyon testi oluşturamazsınız. ... ctd
Glen_b

1
ctd ... Test etmediğiniz popülasyon katsayılarını biliyorsanız (ve hatalar her zaman değiştirilebilir olacaktır), ancak bunları gözlemleyemezsiniz. Katsayıların veya hataların (yani artıkların) tahminlerini değiştirirseniz, miktarlar daha uzun değişebilir. Bununla birlikte, bazı özel koşullar altında yaklaşık olarak değiştirilebilirler (bazı insanlar tam olarak bunu yapmayı savunuyorlar) .... ve bunu yaparsanız, bir önyüklemeye benzer bir şeyle sonuçlanır, ancak yerine örnekleme yerine örneklemeyle örnekleme yaparsınız.
Glen_b

Teşekkür ederim; Bunu dikkatlice düşüneceğim. Burada öğrenmem için daha derin bir şey olduğundan şüpheleniyorum. :)
usεr11852 diyor Reinstate Monic

1
@NULL nedense referans talebinizi cevapsız bıraktım. Bir başlangıç ​​noktası için, buradaki bazı referansların yapması gerekenler: davegiles.blogspot.com/2019/04/…
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.