Wilcoxon imzalı rütbe testinin uygunluğu


11

Çapraz Onaylı arşivlerde biraz dolaştım ve soruma cevap bulamadım. Sorum şu: Vikipedi Wilcoxon imzalı rütbe testi (sorularım için biraz değiştirildi) için tutulması gereken üç varsayım sunuyor:

İ = 1, ..., n için Zi = Xi-Yi olsun.

  1. Zi farklılıklarının bağımsız olduğu varsayılmaktadır.

  2. (a.) Her bir Zi aynı sürekli popülasyondan gelir ve (b.) her bir Zi ortak bir medyan etrafında simetriktir;

  3. Xi ve Yi'nin temsil ettiği değerler sıralanmıştır ... bu nedenle 'daha büyük', 'küçük' ve 'eşit' karşılaştırmaları yararlıdır.

Bununla birlikte, R'deki? Wilcox.test dokümantasyonu, (2.b) 'nin aslında prosedür tarafından test edilen bir şey olduğunu göstermektedir:

"... hem x hem de y verilir ve eşlenirse TRUE ise, x - y (eşleştirilmiş iki örnek durumda) dağılımının mu hakkında simetrik olduğu null değerinin Wilcoxon imzalı bir sıralama testi."

Bana bu sesler testi "Z simetrik etrafında medyan mu = SomeMu dağıtılır" şeklindeki sıfır hipotezi için yapılır sanki - Böyle boş fo ret olabileceğini ya simetri bir ret veya bir ret olduğunu etrafına mu Z simetriktir SomeMu.

Bu wilcox.test için R belgelerinin doğru anlaşılması mı? Bunun önemli olmasının sebebi, elbette, bazı öncesi ve sonrası veriler üzerinde bir dizi eşleştirilmiş fark testi yürütmemdir (yukarıdaki "X" ve "Y"). "Önce" ve "sonra" verileri tek tek eğridir, ancak farklar neredeyse o kadar eğri değildir (yine de biraz eğik olsa da). Bununla, tek başına kabul edilen "önce" veya "sonra" verilerinin eğriliği ~ 7 ila 21 (baktığım örneğe bağlı olarak) varken, "farklılıklar" verilerinin eğriliği ~ = 0.5 ila 5 arasındadır. ama neredeyse o kadar değil.

"Farklılıklar" verilerimde çarpıklık olması, Wilcoxon testinin bana yanlış / taraflı sonuçlar vermesine neden olacaksa (Wikipedia makalesinde belirtildiği gibi), çarpıklık büyük bir endişe olabilir. Bununla birlikte, Wilcoxon testleri aslında fark dağılımının "mu = SomeMu etrafında simetrik" olup olmadığını test ediyorsa (? Wilcox.test'in belirttiği gibi), bu daha az endişe vericidir.

Benim sorularım:

  1. Yukarıdaki hangi yorum doğrudur? Benim "farklılıklar" dağılımımdaki çarpıklık Wilcoxon testime ağırlık verecek mi?

  2. Çarpıklık varsa olduğunu bir endişe: "çok çarpıklık bir husustur Nasıl"

  3. Wilcoxon imzalı rütbe testleri burada oldukça uygunsuz görünüyorsa, ne kullanmam gerektiğine dair herhangi bir öneriniz var mı?

Çok teşekkürler. Bu analizi nasıl yapabilirim hakkında başka önerileriniz varsa, onları duymaktan çok mutluyum (yine de bu amaç için başka bir iş parçacığı açabiliyorum). Ayrıca, bu Cross Crossted ile ilgili ilk sorum; bu soruyu nasıl sorduğum hakkında önerileriniz / yorumlarınız varsa, ben de buna açıkım!


Küçük bir arka plan: "Firma üretimindeki hatalar" olarak adlandıracağım gözlemleri içeren bir veri kümesini analiz ediyorum. Sürpriz bir denetimden önce ve sonra üretim sürecinde meydana gelen hatalar üzerine bir gözlemim var ve analizin amaçlarından biri, "denetim oberledilen hata sayısında bir fark yaratıyor mu?"

Veri kümesi şuna benzer:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

Yaklaşık 4000 gözlem var. Diğer değişkenler firmaların özelliklerini azaltan katagorik gözlemlerdir. Boyut küçük, orta veya büyük olabilir ve her firma bunlardan sadece bir tanesidir. Firmalar "tiplerin" herhangi biri veya tamamı olabilir.

Tüm firmalar ve çeşitli alt grupların (boyut ve tür bazında) muayenelerinden önce ve sonra gözlenen hata oranlarında istatistiksel olarak önemli farklılıklar olup olmadığını görmek için bazı basit testler yapmam istendi. T-testleri dışarıdaydı çünkü veriler hem öncesi hem de sonrasında ciddi şekilde çarpıtılmıştı, örneğin R'de veriler aşağıdaki gibi görünüyordu:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(Bunlar oluşturuldu - özel / gizlilik sorunları nedeniyle gerçek verileri veya gerçek manipülasyonlarını gönderemiyorum - özür dilerim!)

Eşleştirilmiş farklılıklar daha merkezileşmiştir ancak normal bir dağılıma çok iyi uymamıştır - çok fazla zirve yapmıştı. Fark verileri aşağıdaki gibi görünüyordu:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

Wilcoxon imzalı bir rütbe testi kullanmam önerildi ve? Wilcox.test ve Wikipedia'ya kısa bir ikna ettikten sonra, bu, testin kullanılması gibi görünüyor. Yukarıdaki varsayımlar göz önüne alındığında, veri oluşturma süreci göz önüne alındığında (1) iyi olduğunu düşünüyorum. Varsayım (2.a) verilerim için kesin olarak doğru değil, ancak buradaki tartışma: Dağıtım sürekli olmadığında Wilcoxon testine alternatif mi? bunun çok fazla endişe kaynağı olmadığını belirtiyor gibiydi. Varsayım (3) iyidir. Tek endişem (inanıyorum) Varsayım (2.b).

Birkaç yıl sonra ek bir not : Sonunda mükemmel bir parametrik olmayan istatistik kursu aldım ve rütbe toplamı testlerine çok zaman harcadım. Varsayımla (2.a) gömülü, "Her Zi aynı sürekli popülasyondan gelir", her iki örnek mantarın da eşit varyansa sahip popülasyonlardan geldiği fikridir - bu pratik olarak son derece önemlidir. Populasyonlarınızdaki farklı varyansla ilgili endişeleriniz varsa (örnekleri çizdiğiniz), WMW kullanma konusunda endişelenmelisiniz.


İki cevap için teşekkürler! İkisi de bana eşit derecede yardım etti. Eğer yapabilseydim "her ikisini de seçerdim." Mike, Aniko'nun orijinal sorumu biraz daha doğrudan cevaplasa da, kavramsal olarak çok yardımcı olan bazı teorik anlayışlara dikkat çekti. İkinize de teşekkürler!
CompEcon

Yanıtlar:


8

Vikipedi sizi "... hem x hem de y verilirse ve eşleştirilmişse DOĞRU ise, x - y (eşleştirilmiş iki örnek durumda) dağılımının simetrik olduğu null değerinin Wilcoxon imzalı sıralama testi hakkında mu yapılır. "

Test, RANK-TRANSFORMED değerlerinin boş hipotezinizde belirttiğiniz medyan etrafında simetrik olup olmadığını belirler (sıfır kullanacağınızı varsayıyorum). Çarpıklık bir problem değildir, çünkü imzalanmış sıralı test, çoğu parametrik olmayan testte olduğu gibi "dağılımsız" dır. Bu testler için ödediğiniz fiyat genellikle düşük güçtür, ancak bunun üstesinden gelmek için yeterince büyük bir örneğiniz var gibi görünüyor.zben=xben-yben

Sıra toplamı testine "cehennem" alternatifi , bu ölçümlerin kabaca lognormal bir dağılımı takip etme olasılığına karşı ve gibi basit bir dönüşümü denemek olabilir. değerleri "çan eğri" görünmelidir. Daha sonra testte kullanabilir ve kendinizi (ve sadece İş İstatistiklerini alan patronunuzu) rank-toplam testinin çalıştığına ikna edebilirsiniz. Bu işe yararsa, bir bonus vardır: lognormal veriler için t üzerindeki test, orjinal, dönüştürülmemiş ölçümler için medyanların karşılaştırılmasıdır.ln ( y i )ln(xben)ln(yben)

Ben mi? Her ikisini de yapardım ve pişirebileceğim başka bir şey (Poisson üzerinde olasılık oranı testi firma boyutuna göre sayılır?). Hipotez testi tamamen kanıtın inandırıcı olup olmadığını belirlemekle ilgilidir ve bazı insanlar ikna edici bir yığın alırlar.


Ah, bu çok mantıklı. Özellikle şimdi eve döndüm ve bu işaret testlerinin gerçekte ne yaptığının güzel bir açıklamasına sahip eski DeGroot & Schervish ders kitabımı çıkardım. Fantastik. Ve hipotez testiyle ilgili genel düşünceler için teşekkürler :) Perspektifi beğendim. Küçük bir not: yanıltıcı olarak not ettiğiniz kısım aslında R'den, wilcox.test belgelerinden. Bu benim için biraz rahatsız edici ...
CompEcon

9

Hem Wikipedia hem de R yardım sayfası biraz doğru ve aynı şeyi belirtmeye çalışıyorlar, sadece farklı şekilde ifade ediyorlar.

Wikipedia makalesi, hipotezleri (medyan = 0) vs (medyan! = 0) olarak belirtir ve farkların simetrik bir dağılımı (+ diğer varsayımlar) varsa bunu testten çıkarabileceğinizi söyler.

R yardım sayfası daha spesifiktir, hipotezleri (medyan = 0 ve farklılıkların simetrik bir dağılımı vardır) vs (bunlardan en az biri yanlıştır) olarak belirtir. Böylece bir varsayımı sıfır hipoteze taşıdı. Sanırım bunu simetriklik ihtiyacını vurgulamak için yaptılar: çarpık farklılıklarla işaretli sıra testi medyan ölmüş olsa bile sıfır hipotezini reddedecektir. Bir ders kitabı okursanız, test edilen sıfır hipotezinin P (X> Y) = 0.5 olduğunu söyleyebilir - geri kalanı aslında bunu takip eder.

Uygulama açısından, soru elbette özellikle medyanla ilgilenip ilgilenmediğiniz (ve sonra çarpıklık bir problemdir ve medyan test olası bir alternatiftir) veya tüm dağılımı önemsediğiniz ve P (X> y)! = 0.5 değişikliklerin kanıtıdır.


1
Tamam, bu mantıklı. Giriş için teşekkürler! Medyan testi için Wikipedia sayfasının eşleştirilmemiş Mann-Whitney-U testinin tercih edildiğini fark ettim. Bu, beni hemen başladığım yere geri döndüğümü düşündürüyor, eşleştirilmiş Wilcoxon testinin bir şekilde daha fazla bilgi kullandığını düşünüyor. Belki de gerçekten üzerinde düşünmeye çalıştığım şey, "özellikle ortanca ... ya da tüm dağıtımla ilgilenmek" dediğinde kastettiğin şeydir. Tüm dağıtım umurumda, ancak medyan ile karakterize
ediyorum
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.