Çapraz Onaylı arşivlerde biraz dolaştım ve soruma cevap bulamadım. Sorum şu: Vikipedi Wilcoxon imzalı rütbe testi (sorularım için biraz değiştirildi) için tutulması gereken üç varsayım sunuyor:
İ = 1, ..., n için Zi = Xi-Yi olsun.
Zi farklılıklarının bağımsız olduğu varsayılmaktadır.
(a.) Her bir Zi aynı sürekli popülasyondan gelir ve (b.) her bir Zi ortak bir medyan etrafında simetriktir;
Xi ve Yi'nin temsil ettiği değerler sıralanmıştır ... bu nedenle 'daha büyük', 'küçük' ve 'eşit' karşılaştırmaları yararlıdır.
Bununla birlikte, R'deki? Wilcox.test dokümantasyonu, (2.b) 'nin aslında prosedür tarafından test edilen bir şey olduğunu göstermektedir:
"... hem x hem de y verilir ve eşlenirse TRUE ise, x - y (eşleştirilmiş iki örnek durumda) dağılımının mu hakkında simetrik olduğu null değerinin Wilcoxon imzalı bir sıralama testi."
Bana bu sesler testi "Z simetrik etrafında medyan mu = SomeMu dağıtılır" şeklindeki sıfır hipotezi için yapılır sanki - Böyle boş fo ret olabileceğini ya simetri bir ret veya bir ret olduğunu etrafına mu Z simetriktir SomeMu.
Bu wilcox.test için R belgelerinin doğru anlaşılması mı? Bunun önemli olmasının sebebi, elbette, bazı öncesi ve sonrası veriler üzerinde bir dizi eşleştirilmiş fark testi yürütmemdir (yukarıdaki "X" ve "Y"). "Önce" ve "sonra" verileri tek tek eğridir, ancak farklar neredeyse o kadar eğri değildir (yine de biraz eğik olsa da). Bununla, tek başına kabul edilen "önce" veya "sonra" verilerinin eğriliği ~ 7 ila 21 (baktığım örneğe bağlı olarak) varken, "farklılıklar" verilerinin eğriliği ~ = 0.5 ila 5 arasındadır. ama neredeyse o kadar değil.
"Farklılıklar" verilerimde çarpıklık olması, Wilcoxon testinin bana yanlış / taraflı sonuçlar vermesine neden olacaksa (Wikipedia makalesinde belirtildiği gibi), çarpıklık büyük bir endişe olabilir. Bununla birlikte, Wilcoxon testleri aslında fark dağılımının "mu = SomeMu etrafında simetrik" olup olmadığını test ediyorsa (? Wilcox.test'in belirttiği gibi), bu daha az endişe vericidir.
Benim sorularım:
Yukarıdaki hangi yorum doğrudur? Benim "farklılıklar" dağılımımdaki çarpıklık Wilcoxon testime ağırlık verecek mi?
Çarpıklık varsa olduğunu bir endişe: "çok çarpıklık bir husustur Nasıl"
Wilcoxon imzalı rütbe testleri burada oldukça uygunsuz görünüyorsa, ne kullanmam gerektiğine dair herhangi bir öneriniz var mı?
Çok teşekkürler. Bu analizi nasıl yapabilirim hakkında başka önerileriniz varsa, onları duymaktan çok mutluyum (yine de bu amaç için başka bir iş parçacığı açabiliyorum). Ayrıca, bu Cross Crossted ile ilgili ilk sorum; bu soruyu nasıl sorduğum hakkında önerileriniz / yorumlarınız varsa, ben de buna açıkım!
Küçük bir arka plan: "Firma üretimindeki hatalar" olarak adlandıracağım gözlemleri içeren bir veri kümesini analiz ediyorum. Sürpriz bir denetimden önce ve sonra üretim sürecinde meydana gelen hatalar üzerine bir gözlemim var ve analizin amaçlarından biri, "denetim oberledilen hata sayısında bir fark yaratıyor mu?"
Veri kümesi şuna benzer:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Yaklaşık 4000 gözlem var. Diğer değişkenler firmaların özelliklerini azaltan katagorik gözlemlerdir. Boyut küçük, orta veya büyük olabilir ve her firma bunlardan sadece bir tanesidir. Firmalar "tiplerin" herhangi biri veya tamamı olabilir.
Tüm firmalar ve çeşitli alt grupların (boyut ve tür bazında) muayenelerinden önce ve sonra gözlenen hata oranlarında istatistiksel olarak önemli farklılıklar olup olmadığını görmek için bazı basit testler yapmam istendi. T-testleri dışarıdaydı çünkü veriler hem öncesi hem de sonrasında ciddi şekilde çarpıtılmıştı, örneğin R'de veriler aşağıdaki gibi görünüyordu:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Bunlar oluşturuldu - özel / gizlilik sorunları nedeniyle gerçek verileri veya gerçek manipülasyonlarını gönderemiyorum - özür dilerim!)
Eşleştirilmiş farklılıklar daha merkezileşmiştir ancak normal bir dağılıma çok iyi uymamıştır - çok fazla zirve yapmıştı. Fark verileri aşağıdaki gibi görünüyordu:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Wilcoxon imzalı bir rütbe testi kullanmam önerildi ve? Wilcox.test ve Wikipedia'ya kısa bir ikna ettikten sonra, bu, testin kullanılması gibi görünüyor. Yukarıdaki varsayımlar göz önüne alındığında, veri oluşturma süreci göz önüne alındığında (1) iyi olduğunu düşünüyorum. Varsayım (2.a) verilerim için kesin olarak doğru değil, ancak buradaki tartışma: Dağıtım sürekli olmadığında Wilcoxon testine alternatif mi? bunun çok fazla endişe kaynağı olmadığını belirtiyor gibiydi. Varsayım (3) iyidir. Tek endişem (inanıyorum) Varsayım (2.b).
Birkaç yıl sonra ek bir not : Sonunda mükemmel bir parametrik olmayan istatistik kursu aldım ve rütbe toplamı testlerine çok zaman harcadım. Varsayımla (2.a) gömülü, "Her Zi aynı sürekli popülasyondan gelir", her iki örnek mantarın da eşit varyansa sahip popülasyonlardan geldiği fikridir - bu pratik olarak son derece önemlidir. Populasyonlarınızdaki farklı varyansla ilgili endişeleriniz varsa (örnekleri çizdiğiniz), WMW kullanma konusunda endişelenmelisiniz.