ANOVA ve Kruskal-Wallis testi arasındaki fark


20

R öğreniyorum ve varyans analizi ile denemeler yapıyorum. İkisini de çalıştırıyorum

kruskal.test(depVar ~ indepVar, data=df)

ve

anova(lm(depVar ~ indepVar, data=dF))

Bu iki test arasında pratik bir fark var mı? Benim anlayışım, ikisinin de popülasyonların aynı anlama sahip olduğu sıfır hipotezini değerlendirdikleri.

Yanıtlar:


28

Test edilen varsayımlarda ve hipotezlerde farklılıklar vardır.

ANOVA (ve t-testi) açıkça değerlerin eşitliği testidir. Kruskal-Wallis (ve Mann-Whitney) ortalama bir karşılaştırma olarak teknik görülebilir sıralarında .

Bu nedenle, orijinal değerler açısından, Kruskal-Wallis, bir araç karşılaştırmasından daha geneldir : her gruptan rastgele bir gözlemin, başka bir gruptan rastgele bir gözlemin eşit derecede üstünde veya altında olma olasılığının olup olmadığını test eder. Bu karşılaştırmanın altında yatan gerçek veri miktarı ne ortalamadaki farklar ne de medyanlar arasındaki farktır (iki örneklemde), aslında tüm çiftli farklılıkların medyanıdır - örnek arasındaki Hodges-Lehmann farkı.

Bununla birlikte, bazı kısıtlayıcı varsayımlar yapmayı seçerseniz, Kruskal-Wallis, nüfus araçlarının yanı sıra kantillerin (örneğin medyanların) ve gerçekten de çok çeşitli diğer önlemlerin eşitliğinin bir testi olarak görülebilir. Yani, sıfır hipotezi altındaki grup dağılımlarının aynı olduğunu ve alternatif altında, tek değişiklik dağılımsal bir kayma (" konum kaydırma alternatifi " olarak adlandırılır) olduğunu varsayarsanız , o zaman bir testtir Nüfus araçlarının eşitliği (ve aynı zamanda medyanların, alt çeyreklerin vb.).

[Bu varsayımı yaparsanız, ANOVA'da olduğu gibi göreli kaymalar için tahminler ve aralıklar elde edebilirsiniz. Bu varsayım olmadan aralıklar elde etmek de mümkündür, ancak yorumlanması daha zordur.]

Burada cevaba bakarsanız , özellikle sonuna doğru, t-testi ve Wilcoxon-Mann-Whitney arasındaki karşılaştırmayı tartışır (ki en azından iki kuyruklu testler yaparken) ANOVA ve Kruskal-Wallis'e eşdeğerdir sadece iki örneğin karşılaştırılmasına uygulanır; biraz daha ayrıntı verir ve bu tartışmaların çoğu Kruskal-Wallis'e karşı ANOVA'ya aktarılır.

Pratik bir farkla ne demek istediğiniz tam olarak belli değil. Bunları genellikle benzer bir şekilde kullanırsınız. Her iki varsayım kümesi de uygulandığında, genellikle oldukça benzer sonuçlar vermeye eğilimlidirler, ancak bazı durumlarda kesinlikle farklı p değerleri verebilirler.

Düzenleme: İşte küçük örneklerde bile çıkarımın benzerliğine bir örnek - burada, normal dağılımlardan (küçük örnek büyüklükleri ile) örneklenmiş üç grup (her biri ikinci ve üçüncü her biri birinci ile karşılaştırıldığında) arasında yer değiştirme için ortak kabul bölgesi. belirli bir veri kümesi için% 5 düzeyinde:

Kruskal-Wallis ve Anova'da yer farklılıkları için kabul bölgeleri

Çok sayıda ilginç özellik görülebilir - bu durumda KW için biraz daha büyük kabul bölgesi, dikey, yatay ve çapraz düz çizgi segmentlerinden oluşan sınırı ile (nedenini anlamak zor değildir). İki bölge bize buradaki ilgi parametreleri hakkında çok benzer şeyler anlatıyor.


2
+1. Sadece gerekli olduğunu düşündüğüm yere vurgu eklemek için biraz düzenlemeye cesaret ettim. Lütfen kabul edip etmediğinizi şimdi görün.
13:58, ttnphns

@ttnphns düzenleme için teşekkürler. Ben orijinal arka bazılarını düzenleyebilirsiniz böylece değişti bazı şeyler orada olduğunu neden bazı belirli nedenleri vardır. Ancak, belki bunu daha net yapmalıdır neden bunu daha önce olduğu gibi ben yazdım. Ama önce değişikliklerinizi olabildiğince iyi tutmanın yollarını dikkatlice düşünmek istiyorum.
Glen_b

4

Evet var. anovaEderken bir parametrik yaklaşımdır kruskal.testolmayan bir parametrik bir yaklaşımdır. Dolayısıyla kruskal.testherhangi bir dağıtım varsayımına gerek yoktur.
Pratik bakış açısından, verileriniz çarpık olduğunda, anovakullanmak için iyi bir yaklaşım olmaz. Örneğin bu soruya bir göz atın .


4
Kruskal-Wallis ANOVA'nın parametrik ANOVA'ya kıyasla dağılımlarla ilgili rahat varsayımlar yaptığını söyleyebilirim: her gruptaki gözlemler benzer şekle sahip popülasyonlardan gelir . Heteroskedastisite veya yüksek derecede çarpık dağılımlar geleneksel testlerde olduğu gibi sorunlu olmaya devam etmektedir.
chl

2
Nasıl yani @chl? Rütbeler eğriltme ile değiştirilmez ve KW rütbe tabanlıdır. Neyi kaçırıyorum?
Peter Flom - Monica'yı eski durumuna döndürün

6
3/π

'H0

1
@ StéphaneLaurent Şekiller aynı değilse, kötü çıkarımlara yol açabilir. benim örneğimi burada görebilirsiniz
Flask

3

Δresim açıklamasını buraya girin

(*)'H0:{Δ=0}'H1:{Δ0}(*)'H0'H0)(*)'H0:{dağılımlar eşittir}

(*)Δ>0Δ

xyn=1000'H0

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

resim açıklamasını buraya girin

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

Başlangıçta iddia ettiğim gibi, KW'nin kesin yapısı hakkında emin değilim. Belki cevabım başka bir parametrik olmayan test için daha doğrudur (Mann-Whitney? ..), ancak yaklaşım benzer olmalıdır.


1
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersionGlen'in cevabında, yorumlarda ve bu sitedeki diğer birçok yerde belirtildiği gibi, doğrudur, ancak testin ne yaptığının daralmasıdır. same shape/dispersionaslında içsel değildir, ancak bazı durumlarda kullanılan ve diğer durumlarda kullanılmayan ek bir varsayımdır.
1359 ttnphns

PS 2. örneğiniz KW testiyle çelişmiyor veya reddetmiyor. Testin H0 değeri değil distributions are equal , bunu düşünmek yanlıştır. H0, yalnızca, "yerçekimlerinin yoğunlaşması" nın iki noktasının birbirinden sapmamasıdır.
13:25, ttnphns

'H0

1
krusal.test()'H0

1
Evet. the equality of the location parameters of the distribution("yer" genel olarak sadece ortalama veya medyan olarak düşünülmemelidir). Eğer aynı şekiller varsayalım, o zaman, doğal olarak, bu aynı H0 "özdeş dağıtım" olur.
13:32, ttnphns

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.