zχ2
z -test:
Her ikisi de varsayılan örnekleme dağılımının doğru olup olmadığı konusunda , testinin kullanılmasının uygunluğu konusunda iki endişe vardır . Birincisi, -test dağılımı yerine normal dağılımı kullanır , bu da standart sapmaların örnekleme hatası olmadan bilindiğini gösterir. İkincisi, örnekleme dağılımı süreklidir, ancak veriler ayrıktır; sadece belirli veri kombinasyonları mümkün olduğundan, sadece elde edilen belirli test istatistik değerleri mümkündür, bu da teorik örnekleme dağılımına uymayabilir. (Bu sorunu burada diğer testler bağlamında tartışıyorum: Karşılaştırma ve zıtlıklar, p değerleri, anlamlılık düzeyleri ve tip I hatası .) zzt
İlk endişeyi farklı bir bağlamda ele alalım. Normal olarak dağıtılmış veriye sahip iki grubunuz varsa ve araçların eşdeğer olup olmadığını görmek istiyorsanız, hem araçları hem de standart sapmaları hesaplamanız gerekir. Şimdi, araçların örnekleme hatasına tabi olduğunu biliyoruz, bu yüzden bu iki örnek aracının aynı olmadığını söylemek yerine testi yapmamız gerekiyor. Bununla birlikte, standart sapma tahminlerimizin de örnekleme hatasına tabi tutulması ve bu gerçeği bir şekilde hesaba katmamız gerekiyor. Bunu yaptığımızda, test istatistiği (bir tür ölçeklendirilmiş ortalama fark) olarak dağıtılır . Bunun yerine normal dağılımı kullansaydık (yanitz-test), bu standart sapma tahminlerimizin hatasız olduğunu varsaydığımız anlamına gelir. Öyleyse -test neden sizin durumunuzda kullanılabilir? Bunun nedeni, verilerinizin normal yerine binom (yani, bilinen toplam 'deneme' toplamından 'başarı' sayısı) olmasıdır. Gelen binom dağılımı , standart sapma Eğer ortalama yaklaşık endişe zorunda hiçbir ek belirsizlik olduğu tahmin var bu yüzden bir kez, ortalama değerin bir fonksiyonudur. Böylece, normal dağılım, test istatistiğinin örnekleme dağılımının bir modeli olarak kullanılabilir. z
Test istatistiğinin uzun dönem davranışını anlamak için normal dağılımı kullanmak teknik olarak doğru olsa da, başka bir sorun ortaya çıkar. Sorun normal dağılımın sürekli olmasıdır, ancak verileriniz ayrık olduğundan, teorik dağılımdaki tüm değerler veri kümenizde bulunmayabilir. (Yine, yukarıda bağlantılı yanıtında önemli ölçüde daha ayrıntılı olarak bu konuyu görüşmek.) Neyse ki, verilerinizin olası sonuçlar ve teorik Normal örnekleme dağılımının arasındaki maç daha iyi büyüdükçe . Sizin durumunuzda, asıl altta yatan olasılıklar ne olursa olsun, her grupta tüm başarılar kadar az veya hiç yok olabilir. Bu, olası kombinasyonların sayısının olduğu anlamına gelirN91×91=1,729ki bu bir çok olasılık. Küçük bir veri kümesi ile, bağlantılı cevabımda tartıştığım bazı problemlerle karşılaşabilirsiniz, ancak ile endişelenecek çok fazla şeyiniz yok. testinin araştırmacılar için geçerli bir seçim olduğuna inanıyorum . N=180z
χ2 2test:
Peki ya 2test? Bence bu da geçerli bir seçim, ama benim ilk seçimim olmayacak. (Yukarıda tartışılan ikinci kaygının - ayrık veriler ve sürekli referans dağılımı arasındaki uyumsuzluk - testine olduğu kadar testi için de geçerli olduğunu belirtmek isterim, bu yüzden burada avantaj yok.) ile ilgili sorunχ2χ2zχ2-test, satır toplamlarına göre sütun toplamları hakkında özel bir şey olmadığını varsaymaz; her ikisi de diğer olası değerlermiş gibi ele alınır. Ancak, bu deney düzeneğini doğru bir şekilde yansıtmaz. 180 kişi vardı ve her gruba 90 kişi atandı. Tekrarlanan özdeş çalışmalarda gerçekten farklılık gösterecek tek şey, her grupta üşüten insanların sayısıdır. -test yanlış davranır soğuk algınlığı sayısı ve değişebilir gibi her gruptaki hastaların sayısı, ancak her iki doğru varsayımına dayanır testinde gösterilebilir. testinin burada daha fazla gücü olmasının nedeni budur . χ2zz
Değer için, @jbowman tarafından önerilen permütasyon testi de tasarımınızın bu yönünü doğru bir şekilde alır ve sürekli sürekli uyumsuzluk sorunundan muzdarip değildir. Bu nedenle, en iyi seçenektir. Ancak, - ve testlerinin durumunuzda nasıl karşılaştırıldığı hakkında biraz daha fazla bilgi edinmek isteyebileceğinizi düşündüm . zχ2