Eşitsiz varyans altında Mann-Whitney null hipotezi


9

Mann-Whitney U testinin geçersiz hipotezini merak ediyorum. Genellikle sıfır hipotezinin iki popülasyonun eşit dağılımlara sahip olduğunu ifade ettiğini görüyorum. Ama düşünüyorum - aynı ortalama ancak son derece eşit olmayan bir varyansa sahip iki normal popülasyonum olsaydı, Mann-Whitney testi muhtemelen bu farkı tespit etmezdi.

Mann-Whitney testinin sıfır hipotezinin Pr(X>Y)=0.5veya bir popülasyondan ( ) bir gözlemin ikinci popülasyondan ( ) bir gözlemi aşan (bağların dışlanmasından sonra) olasılığı 0.5'e eşittir. Bu biraz daha mantıklı görünüyor, ancak belirttiğim ilk sıfır hipotezine eşdeğer görünmüyor.XY

Bunu çözmek için biraz yardım almayı umuyorum. Teşekkürler!

Yanıtlar:


5

Mann-Whitney testi, permütasyon testinin özel bir durumudur (sıfırın altındaki dağılım, verilerin olası tüm permütasyonlarına bakılarak türetilir) ve permütasyon testleri, aynı dağılımlar olarak null değerine sahiptir, bu nedenle teknik olarak doğrudur.

Mann-Whitney test istatistiğini düşünmenin bir yolu, bir gruptan rastgele seçilen bir değerin diğer gruptan rastgele seçilen bir değeri kaç kez aştığının ölçüsüdür. Dolayısıyla P (X> Y) = 0.5 de mantıklıdır ve bu teknik olarak eşit dağılımların bir özelliğidir (bir kravat olasılığının 0 olduğu sürekli dağılımlar varsayarak). 2 dağılım aynı ise, X'in Y'den daha büyük olma olasılığı 0.5'tir, çünkü her ikisi de aynı dağıtımdan çekilir.

Aynı ortalama fakat çok farklı varyanslara sahip 2 dağılım durumu, 2. null hipotezi ile eşleşir, ancak aynı dağılımların 1'ine karşılık gelmez. Bu durumda p-değerleri ile ne olduğunu görmek için bazı simülasyonlar yapabiliriz (teoride eşit olarak dağıtılmalıdırlar):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

Açıkçası bu, olması gerekenden daha sık reddediyor ve sıfır hipotezi yanlış (bu dağılımların eşitliğiyle eşleşiyor, ancak prob = 0.5 ile eşleşmiyor).

Efron'un Zarlarına dayanan popülasyonları karşılaştırırsanız, X> Y olasılığı açısından düşünmek de bazı ilginç problemlerle karşılaşır .


Merhaba Greg, cevap için teşekkürler. Söylediğiniz gibi görünüyor, testin eşit dağılımlar altında düzgün çalışmadığı özel bir durum buldum. Dahası, belirttiğim sıfır hipotezleri eşit değildir. Bu doğru mu?
Jimj

4

Mann-Whitney eşit ortalama varyans değişikliklere hassas değildir, ama olabilir - Eğer ile görüldüğü gibi talebi bu farklılıkları tespit biçim sapmasına (örneğin burada hem ortalama hem de varyans birlikte artar). Eşit ortalamada iki normaliniz varsa, farklılıkları sıfır civarında simetriktir. Bu nedenle , boş durum budur.P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

Örneğin, dağılımını varsa ortalama ile varlık üstel iken ortalama ile üstel dağılıma sahip (bir ölçek değişikliği), Mann-Whitney her iki tarafın da günlükleri alarak aslında (yani duyarlıdır, onun sadece a yer değiştirme ve Mann-Whitney monoton dönüşümden etkilenmez).Y1Xk

-

Medyanların eşitliği altında yayılma farklılıklarına duyarlı olan kavramsal olarak Mann-Whitney'e çok benzeyen testlerle ilgileniyorsanız , bu tür birkaç test vardır.

Orada Siegel-Tukey testi ve Ansari-Bradley testi hem yakından Mann-Whitney-Wilcoxon iki örnek testi ile ilgili, örneğin,.

Her ikisi de sonlardan sıralama temel fikrine dayanmaktadır.

R kullanırsanız, Ansari-Bradley testi yerleşiktir ... ?ansari.test

Siegel-Tukey aslında örnekten farklı hesaplanmış derecelerde bir Mann-Whitney-Wilcoxon testi yapar; verileri kendiniz sıralarsanız, p değerleri için gerçekten ayrı bir işleve ihtiyacınız yoktur. Yine de, burada olduğu gibi bazılarını bulabilirsiniz:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(ttnphns'ın orijinal cevabım altındaki yorumu ile ilgili olarak)

@GregSnow ile özellikle önemli bir anlamda katılmıyorum olarak okuduğum yanıtı aşırı yorumluyorsunuz. Vurgu ve bir dereceye kadar ne hakkında konuştuğumuz konusunda kesinlikle bir fark var, ama arkasında çok fazla gerçek anlaşmazlık varsa çok şaşırırdım.

Mann ve Whitney'den alıntı yapalım: " hipotezini test etmek için 've ' nin göreceli derecelerine bağlı bir istatistik önerilmektedir . " Bu kesin; @ GregSnow'ın konumunu tamamen destekler.Uxyf=g

": Şimdi, hadi istatistik oluşturulma biçimine bakın bakalım kez numara bir saymak bir önce gelen .Uyx Şimdi" eğer onların boş doğrudur, o olayı olasılığıdır ... ama 0,5 olasılık elde etmenin başka yolları da vardır ve bu anlamda testin başka koşullarda çalışabileceği düşünülebilir. > (yeniden ölçeklendirilmiş) bir olasılık tahmin ettikleri ölçüde , söylediklerimi destekliyor.12YX

Ancak, önem düzeylerinin tam olarak doğru olacağı garanti edilmek için , null dağılımla eşleşmesi için dağılımına ihtiyacınız olacaktır. Bu, ve grup etiketleri etiketlerinin sıfır altındaki birleşik gözlemlere yönelik tüm permütasyonlarının eşit derecede olası olduğu varsayımından kaynaklanmaktadır . Kesinlikle altındaki durum budur . Tam olarak @GregSnow'un dediği gibi.UXYf=g

Soru, durumun ne ölçüde olduğu (yani test istatistiğinin dağılımının , daha genel olarak ifade edilmiş boş için veya yaklaşık olarak varsayım altında türetilmiş olanla eşleştiği ).f=g

İnanıyorum ki birçok durumda; özellikle de tanımladığınız durumdan daha genel dahil olmak üzere (aynı ortalama ancak son derece eşit olmayan varyansa sahip iki normal popülasyon, sonuçlara göre sonuç dağılımını değiştirmeden biraz genelleştirilebilir), test istatistiğinin dağılımının türetildiği dağıtımın aynı olduğu ve bu nedenle de burada geçerli olması gerektiği ortaya çıktı. Bunu destekliyor gibi görünen bazı simülasyonlar yaptım. Bununla birlikte, her zaman çok yararlı bir test olmayacaktır (zayıf bir güce sahip olabilir).

Durumun böyle olduğuna dair hiçbir kanıt sunmuyorum. Bazı sezgi / el-dalgalı argüman uyguladım ve ayrıca doğru olduğunu gösteren bazı temel simülasyonlar yaptım - Mann-Whitney'in çalıştığı (null altında 'doğru' dağılımına sahip olduğu) den çok daha geniş .f=g

Ne yaparsan yap, ama bunu @GregSnow ile somut bir anlaşmazlık olarak yorumlamıyorum.

Referans - Mann & Whitney'in orijinal makalesi


Vikipedi'nin Mann-Whitney tartışma sayfasından bu sözlerle hemfikir olduğunuzu doğru anladım mı the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation? Yani @ Greg'in cevabına katılmıyorsun, değil mi?
ttnphns

Düzenlemeye biraz tartışma ekledim.
Glen_b -Monica'yı geri yükle20.04.2013

Çok güzel bir ek. Bunu inceleyeceğim (MW testinde beni atlatmaya devam eden nüanslar varmış gibi hissettim). Bu arada şunu söyler miyim kabul edersiniz: "MW test istatistiği ortalama sıralamanın sadece (in) eşitliğini yansıttığından , f ~ = g [f, g'yi orijinal dağılımlar olarak, önceki sıralama olarak anlıyorum] fakat f = g ile aynı H0 ile uğraşmaya devam ettiğinden, test hiçbir şekilde tamamen anlamsızdır. Bu duruma bir örnek, yayılma parametresi (varyans) hariç tamamen aynı olan simetrik dağılımlardır ".
ttnphns

Gösterimde (bu arada Mann ve Whitney's), ve , ve yoğunluklarıdır . Koşulları doğruladığım / anladığım ölçüde, beyanınız böyle görünüyor. Mann-Whitney hakkında hala beni çekecek çok şey olduğundan şüpheleniyorum. fgXY
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.