2 ampirik ayrık dağılım arasındaki farkı test edin


14

Ampirik dağılımlar olarak kullandığım ayrık dağılımlardan birkaç büyük örneğimin olduğu test verilerim var. Dağılımların gerçekten farklı olup olmadığını ve aslında farklı olan dağıtımlar için ortalamalardaki farkın ne olduğunu test etmek istiyorum.

Kesikli dağılımlar olduklarından, anlayışım Kolmogorov-Smirnov testinin altında yatan sürekli dağıtım varsayımı nedeniyle geçersiz olduğudur. Chi-Squared testi dağılımların gerçekten farklı olup olmadığı için doğru test olur mu?

Ortalamalardaki fark için hangi testi kullanırdım? Daha iyi bir yaklaşım dağılımlardan örnek alıp farkı alıp farkın dağılımı üzerine analiz yapmak mıdır?


Evet, testi doğru olanıdır. Bu soruya kabul edilen cevap bu konuyu ayrıntılarıyla açıklamaktadır. dağılım 1 = urn 1 ve dağıtım 2 = urn 2 . Burada, rastgele değişkenlerin değerleri renklerdir ve sizin durumunuzda muhtemelen başka bir şey, örneğin ayrık sayılardır. χ2
Georg Schnabel

Geri bildirim için teşekkürler. Ki-kare testi dağılımların farklı olduğunu doğruladığında, araçlardaki farkın ne olduğuna dair bir test var mı?
Wallhood

Daha iyi bir yaklaşım dağılımlardan örnek almak ve farkı alıp fark üzerine analiz yapmak mıdır?
Wallhood

Yanıtlar:


13

1) Kolmogorov-Smirnov hala kullanılabilir, ancak tablolandırılmış kritik değerleri kullanırsanız, muhafazakar olacaktır (bu sadece bir problemdir, çünkü güç eğrinizi aşağı iter). İstatistiğin permütasyon dağılımını elde etmek daha iyidir, böylece önem seviyeleriniz onları seçtiğiniz şeydir. Bu, ancak çok fazla bağ varsa büyük bir fark yaratacaktır. Bu değişikliğin uygulanması gerçekten kolaydır . (Fakat KS testi böyle bir karşılaştırma mümkün değildir; eğer bir kişi permütasyon dağılımlarını hesaplıyorsa, başka olasılıklar da vardır.)

2) ayrı veriler için vanilya ki-kare uyum iyiliği testleri genellikle, bence, gerçekten kötü bir fikirdir. Yukarıdaki potansiyel güç kaybı KS testini kullanarak sizi durdurduysa, ki-kare ile ilgili sorun genellikle çok daha kötüdür - kategoriler arasındaki sıralama olan (gözlem değerleri) en kritik bilgileri ortaya çıkarır ve gücünü azaltır. siparişi dikkate almayan alternatiflere yayarak, örneğin, yer ve ölçek kayması gibi pürüzsüz alternatifleri tespit etmede daha kötüdür). Yukarıdaki ağır bağların kötü etkileri ile bile, çoğu durumda KS testi hala daha iyi güce sahiptir (yine de Tip I hata oranını düşürürken).

Ki-kare ayrıca siparişi hesaba katmak için modifiye edilebilir (ki-kare, dik polinomlar yoluyla lineer, kuadratik, kübik vb bileşenlere bölün ve sadece düşük dereceli birkaç terim kullanılır - 4 ila 6 ortak seçimlerdir). Rayner ve Best'in (ve diğerlerinin) makaleleri, Neyman-Barton pürüzsüz testlerinden kaynaklanan bu yaklaşımı tartışıyor. Bu iyi bir yaklaşımdır, ancak bunun için yazılıma erişiminiz yoksa, biraz kurulum gerekebilir.

Her iki yaklaşım da iyi olmalıdır, ancak her iki yaklaşımı da değiştirmeyecekseniz, ki-kare KS testinden daha iyi olacaktır - bazı durumlarda daha iyi olabilir ... ya da önemli ölçüde daha kötü olabilir.

Bağlar ağır değilse (yani veriler tarafından alınan birçok farklı değer varsa), KS'yi olduğu gibi düşünürüm. Eğer ılımlılarsa, permütasyon dağılımını hesaplamak isterim. Çok ağırlarsa (yani veriler yalnızca birkaç farklı değer alır), düz ki-kare rekabetçi olabilir.


uyarı için teşekkürler. KS testini veya Chi-Squared
Wallhood
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.