ARKA PLAN: Güvenle atlayın - referans için ve soruyu meşrulaştırmak için burada.
Bu makalenin açılışında şunlar yazıyor:
"Karl Pearson'un ünlü ki-kare beklenmedik durum testi, Normal dağılımına dayanarak z istatistiği adı verilen başka bir istatistikten türetilmiştir. en basit sürümlerinin, eşdeğer z testleriyle matematiksel olarak aynı olduğu gösterilebilir. Testler aynı sonucu verir. Tüm niyet ve amaçlar için “ki-kare” “z-kare” olarak adlandırılabilir. Bir serbestlik derecesi için kritik değerleri, z'nin karşılık gelen kritik değerlerinin karesidir. ”
Bu, CV'de birçok kez iddia edilmiştir ( burada , burada , burada ve diğerleri).
Ve gerçekten biz olabilir kanıtlamak olduğunu eşdeğerdirile:
Diyelim ki ve ve yöntemini kullanarak yoğunluğunu buluyoruz :c d f
. Sorun şu ki, normal dağılımın yoğunluğunu yakın bir biçimde entegre edemiyoruz. Ama bunu ifade edebiliriz:
Normal değerleri simetrik olduğundan:
pdfxpdf√ . Bu eşitlemek normal (şimdi de olacak takılı olması Normal parçası ); ve sonunda : e - x 2 pdf1
Ki kare pdf ile karşılaştırın:
Yana için df, tam olarak elde var ki karenin. 1pdf
Ayrıca, prop.test()
R fonksiyonunu çağırırsak, karar verdiğimiz gibi aynı testini başlatırız .chisq.test()
SORU:
Bu yüzden tüm bu noktaları elde ediyorum, ancak yine de iki nedenden dolayı bu iki testin gerçek uygulaması için nasıl uygulandıklarını bilmiyorum:
Bir z testi karesi alınmaz.
Gerçek test istatistikleri tamamen farklıdır:
Değeri bir için test istatistik olduğu:
burada
χ 2 O i i N E i N p i i i p i n = Asimetrik olarak bir dağılımına yaklaşan Pearson kümülatif test istatistiği . = tipi gözlem sayısı ; = toplam gözlem sayısı; = = popülasyondaki tip fraksiyonunun olduğu sıfır hipotezi ile öne sürülen tip beklenen (teorik) frekansı ; = tablodaki hücre sayısı.
Öte yandan, bir testi için test istatistiği :
p=x1 ile , ve "başarı" sayısı kategorik seviyelerinin her biri deneklerin sayısı üzerinden vardır değişkenler, örneğin ve . x1x2n1n2
Bu formül binom dağılımına dayanıyor gibi görünüyor.
Bu iki test istatistik net bir şekilde farklıdır, ve gerçek test istatistik yanı sıra, farklı sonuçlara neden s -değerlerinin : 5.8481
için ve z testi için, burada ( teşekkür ederim, @ mark999). P için-değeri testi olan Z-testi için ise, . İki kuyruklu ve tek kuyruklu arasındaki fark: (teşekkür ederim @amoeba).2.4183 2 = 5.84817 χ 2 0.01559 / 2 = 0.0077952.4183
0.01559
0.0077
Peki onların hangi seviyede aynı olduklarını söylüyoruz?
chisq.test()
kullanmayı denediniz correct=FALSE
mi?