R kullanarak Kruskal-Wallis veya Mann-Whitney U testi için güç analizi?


Yanıtlar:


3

Gücü hesaplamak kesinlikle mümkündür.

Daha açık olmak gerekirse - ret olasılığını (bazı şekillerde) hesaplayabileceğiniz bir durum elde etmek için yeterli varsayımlarda bulunursanız, gücü hesaplayabilirsiniz.

Wilcoxon-Mann-Whitney'de, (örneğin) dağıtım şekillerini varsayarsanız (dağıtım form (lar) ı hakkında bir varsayım yaparsanız) ve ölçeklerin (spreadler) ve yerlerin belirli değerleri veya konumlardaki farklılıklar hakkında bir miktar varsayım yaparsanız , gücü cebirsel olarak ya da sayısal entegrasyon yoluyla hesaplayabilirsiniz; reddederseniz, red oranını simüle edebilirsiniz.

Örneğin , belirtilen yer farkıyla (ortak bir ölçek için standartlaştırılmış) dağılımından örneklemeyi varsayarsak , örnek boyutları göz önüne alındığında, tüm bu koşulları karşılayan birçok veri kümesini simüle edebilir ve böylece reddetme oranını tahmin edebiliriz. Diyelim ki birim ölçeği ( ) - genellik kaybı olmadan - ve konum farkı olan iki adet dağılımı (konum ölçeği ailesi) var . Yine, genelliği kaybetmeden . Daha sonra, belirtilen bazı örnek boyutu için - (diyelim) - gözlemleri simüle edebilir ve böylece belirli değeri için güç sağlayabiliriz.t5t5σ=1δ=μ2μ1=1μ1=0n1=6,n2=9δ/σ(yani ). İşte R'de kısa bir örnek:1

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

Bunun gibi üç simülasyon 0.321, 0.321 ve 0.316 ret oranları üretti; güç görünüşe göre 0.32 civarındadır (ret sayısı binom olduğundan, bu simülasyonlardan sadece birinden bir güven aralığı hesaplayabilirsiniz ). Uygulamada daha büyük simülasyonlar kullanma eğilimindeyim, ancak çok sayıda farklı 'veya ' simülasyonu yapıyorsanız, her biri için 10000'den fazla simülasyon yapmak istemeyebilirsiniz.nδ

Konum kaydırmanın birçok değeri için yaparak, konum kaydırması isterseniz bu koşullar için bir güç eğrisi bile alabilirsiniz.

İki katına büyük örneklerde ve ortadan bölünmüş gibi olacak (ve böylece artan verilen bir at ) sık sık çeşitli iyi yaklaşımları alabilirsiniz sadece birkaç simülasyonlara gelen değerlerinin. Benzer şekilde, tek yanlı testler için, ret oranı sonra de yakın lineer olma eğilimindedir iyi bir yaklaşım sağlar, yine ( çeşitli de sadece birkaç değerlerinde simülasyonlar alınan değerlern 2 σ 2 δ / σ δ n n 1 - b i δ = δ i Φ - 1 ( 1 - b ) δ δ δ n δn1n2σ2δ/σδnn1biδ=δiΦ1(1b)δδδ(bir düzine iyi seçilmiş değer genellikle bol miktarda bulunur). Hassas yumuşatma seçimleri genellikle veya değerlerinde gücün oldukça iyi bir şekilde tahmin edilmesini sağlar .nδ

Tabii ki konum değişikliği ile kendinizi sınırlamanız gerekmez. Parametrelerde değişikliğine yol açacak herhangi bir değişiklik , araştırabileceğiniz bir şey olacaktır.P(Y2>Y1)

Bu testler null altında dağıtımdan bağımsız (sürekli dağılımlar için) olsa da, davranışın alternatifler için farklı dağıtım varsayımları altında farklı olduğunu unutmayın.

Kruskal-Wallis için durum benzerdir, ancak belirtmek için daha fazla yer değişikliğiniz (veya baktığınız başka herhangi bir durum) vardır.

Bu cevaptaki grafik, çiftler arasında belirli bir korelasyon ile normal dağılımlardan numune almak için çeşitli standartlaştırılmış konum değişimleri boyunca, belirli bir örnek boyutunda işaretli bir sıra testi için eşleştirilmiş bir t testi için bir güç eğrisinin karşılaştırılmasını göstermektedir . Benzer hesaplamalar Mann-Whitney ve Kruskal-Wallis için de yapılabilir.


1

Seninle tamamen aynı sorum vardı. Biraz aradıktan sonra bu paketi buldum: https://cran.r-project.org/web/packages/MultNonParam/MultNonParam.pdf

kwpower (nreps, vardiya, distname = c ("normal", "lojistik"), seviye = 0.05, mc = 0, taylor = YANLIŞ)

nreps: Her gruptaki sayılar.

vardiyalar: Çeşitli hipotezler için alternatif hipotez altında dengeleme.

distname: Temeldeki gözlemlerin dağılımı; şu anda normal ve lojistik desteklenmektedir.

seviyesi: Test seviyesi.

asimptotik hesaplama için mc: 0 veya mc yaklaşımı için pozitif. taylor: mantıksal olarak Taylor serisi yaklaşımının kullanılıp kullanılmadığını belirleme.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.