Kolmogorov – Smirnov testi ve t testi


14

2 örnek KS testinin yorumunu ve 2 grup arasındaki düzenli bir t testinden nasıl farklı olduğunu anlamakta zorluk çekiyorum.

Diyelim ki bir görev yapan erkek ve kadınlarım var ve bu görevden bazı puanlar topluyorum. Nihai hedefim, erkeklerin ve kadınların bu görevde farklı performans gösterip göstermediklerini belirlemektir

Yapabileceğim bir şey, iki grup arasında testte çalıştırmak. Yapabileceğim başka bir şey, erkekler ve kadınlar için ECDF'yi hesaplamak, bunları çizmek ve 2 örnek KS testini yapmaktır. Böyle bir şey alırdım:

resim açıklamasını buraya girin

KS testi

KS testi için sıfır hipotezi, 2 takım sürekli skor dağılımının aynı popülasyondan gelmesidir

KS testi yapılırken şunu elde ederim: D = 0.18888, p değeri = 0.04742

İlk olarak, sonuçları yorumlamamın doğru olup olmadığını kontrol etmek istiyorum. Burada, sıfır hipotezini reddederim ve erkek ve kadın skor dağılımlarının farklı popülasyonlardan geldiğini söyleyebilirim. Başka bir deyişle, erkek ve kadın skorlarının dağılımı birbirinden farklıdır.

Daha spesifik olarak, erkeklerin bu görevde daha düşük puanlar alma olasılığı daha yüksektir ve bu, plandan yorumladığım için 2 cinsiyet arasındaki farktır.

T-testi

Şimdi testte puan değişkeni erkek ve dişi araçlar arasındaki farkı test edecek.

Erkek performansının bu görevde kadınlardan daha kötü olduğu düşünelim. Bu durumda, erkek puanlarının dağılımı düşük bir ortalama etrafında ortalanırken, kadın skoru dağılımı yüksek bir ortalama etrafında ortalanacaktır. Bu senaryo, yukarıdaki grafiğe uygun olacaktır, çünkü erkekler daha düşük puanlara ulaşma olasılığı daha yüksektir

Eğer t testi anlamlı olursa, kadınların ortalama olarak erkeklerden anlamlı derecede yüksek olduğu sonucuna varabilirim. Veya nüfus açısından, kadın skorları, ortalamaları erkek popülasyonundan daha yüksek olan ve farklı popülasyonlardan geldikleri KS sonucuna çok benzeyen bir popülasyondan alınır.

Fark ne?

Yani hem KS hem de t test vakalarında çizeceğim sonuç aynı. Erkekler dişilere göre zayıf performans gösterir. Öyleyse bir testi diğerine göre kullanmanın faydası nedir? KS testini kullanarak elde edebileceğiniz yeni bilgiler var mı?

Gördüğüm şekilde, dağılımı düşük ortalama etrafında olan erkekler ve yüksek ortalama etrafında merkezlenen kadınlar anlamlı t testine neden olan şeydir. Ancak bu aynı gerçeğe göre , erkeklerin daha düşük değerleri puanlama olasılığı daha yüksektir, bu da arsanın yukarıdaki gibi görünmesine ve önemli bir KS testi vermesine neden olacaktır. Bu nedenle, her iki testin sonuçları aynı altta yatan nedene sahiptir, ancak bir KS testinin sadece dağıtım araçlarından daha fazlasını hesaba kattığını ve dağıtımın şeklini dikkate aldığını iddia edebilir, ancak sebebi ayrıştırmak mümkün mü test sonuçlarındaki önemli KS testinin etkisi nedir?

Öyleyse bir KS testinin testte çalıştırılmasının değeri nedir? Ve bu soru için t testinin varsayımlarını karşılayabildiğimi varsayalım


Klasik t-testi Bayesian veri analizinden daha aşağıdır, John Kruschke'nin "Bayes Tahmini" t testinin yerini alır " indiana.edu/~kruschke/BEST/BEST.pdf
Vladislavs Dovgalecs

KS testinin Bayes metotları ile nasıl ilgili olduğundan emin değilim ...
Simon

KS ve t-testini kullanmayı bırak
Vladislavs Dovgalecs

4
@xeon Bu kadar güçlü açıklamalar yapacaksanız, bunları desteklemeniz daha iyi olur. Tavsiyem, cevabımdaki örnekte ne tür bir fark olduğunu belirlememizin faydası olmaz. Neden dağıtımdaki bu farkın, farkına varılamayan bir lehine tanımlanmasında açıkça çalışan bir yaklaşımı terk etmeliyiz?
Glen_b -Monica Monica

1
@Glen_b Bu yüzden bir cevap değil, bir yorum yazdı. OP büyük btw olan kağıt okumadım olabilir; Sadece önermek istedim. Ama çok güçlü bir açıklama yaptığımı ve biraz züppe davrandığımı kabul ediyorum. Biraz kaba olduğum için özür dilerim. Artık olmayacak.
Vladislavs Dovgalecs

Yanıtlar:


19

İki örnek Kolmogorov-Smirnov testini neden kullanmak istediğinize bir örnek olarak:

Nüfus araçlarının benzer olduğunu, ancak varyansların çok farklı olduğunu düşünün. Kolmogorov-Smirnov testi bu farkı ortaya çıkarabilir, ancak t-testi yapamaz.

Ya da dağılımların benzer araçlara ve sd'lere sahip olduğunu, ancak dişilerin (mavi) kadınlarda bimodal dağılımı (kırmızı) olduğunu düşünün:

resim açıklamasını buraya girin

Erkekler ve kadınlar farklı performans gösterir mi? Evet - erkekler ya 7.5-8 ya da 12.5-13 civarında bir yere ulaşma eğilimindeyken, dişiler daha sık ortaya doğru (10'a yakın) daha fazla puan alma eğilimindedir, ancak bu değer hakkında iki değerden daha az kümelenmiştir. erkekler yakınlarda skor yaparlar.

Böylece Kolmogorov-Smirnov, dağıtımda t-testinden çok daha genel bir fark bulabilir.


Ah, mantıklı. Bu mantığı uzatabilir ve bir t testi önemliyse KS testinin de önemli olacağını söyleyebilir miyim, ancak bunun ortalama farktan ve / veya dağılımdaki herhangi bir farktan kaynaklanabileceğini ve böylece KS'nin yorumlanabileceğini söyleyebilir miyim? test etmek zor mu? Öyleyse bir KS testi sadece 2 grup arasında ortalama bir fark olmaması durumunda gerçekten yararlı mıdır?
Simon

T testi ortalama farklılıklara karşı daha duyarlıdır (özellikle popülasyon dağılımları benzer standart sapma ile normale yakınsa). KS testini yorumlamak daha zor olabilir, ancak son cümlenize katılmayacağım. Diğer farklılıkların eşlik ettiği araçlarda küçük bir fark olabilir; t-testi sadece onu bilgilendirme araçlarında farklılık gösterirken, KS testi diğer farklılıklar tarafından bildirilebilir. Yukarıdaki örneği düşünün, ancak araçlarda da küçük bir değişim var; t-testi farkı KS testi kadar kolay yakalayamayabilir.
Glen_b

@Glen_b: KS'nin dağılımların eşit olup olmadığını test ederken, t testi dağılımların aynı ortalamaya sahip olup olmadığını test eder mi?

@fcop Evet ve hayır; varsayımlar göz önüne alındığında ve sıfırın altında, sıradan eşit varyans t-testi aslında dağılımların kimliğini de test etmektedir - onları gerçekten farklı kılan alternatifin (varsayımlarla birlikte) genelliğidir. Elbette, varsayımları tam olarak geçerli olmadığında testleri kullanabiliriz (ve genellikle kullanırız) ve daha sonra davranışlarını null ve alternatif altındaki davranışlarına daha fazla bakıyoruz; t-testi alternatif altında ortalama bir değişikliğe duyarlı olma eğiliminde olurken, KS çok geniş bir alternatif sınıfına karşı biraz hassastır.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.