Ne Düzeyde bir olan


15

ARKA PLAN: Güvenle atlayın - referans için ve soruyu meşrulaştırmak için burada.

Bu makalenin açılışında şunlar yazıyor:

"Karl Pearson'un ünlü ki-kare beklenmedik durum testi, Normal dağılımına dayanarak z istatistiği adı verilen başka bir istatistikten türetilmiştir. en basit sürümlerinin, χ2eşdeğer z testleriyle matematiksel olarak aynı olduğu gösterilebilir. Testler aynı sonucu verir. Tüm niyet ve amaçlar için “ki-kare” “z-kare” olarak adlandırılabilir. Bir serbestlik derecesi için χ2 kritik değerleri, z'nin karşılık gelen kritik değerlerinin karesidir. ”

Bu, CV'de birçok kez iddia edilmiştir ( burada , burada , burada ve diğerleri).

Ve gerçekten biz olabilir kanıtlamak olduğunu χ1df2 eşdeğerdirX2ileXN(0,1):

Diyelim ki XN(0,1) ve Y=X2 ve yöntemini kullanarak yoğunluğunu buluyoruz :c d fYcdf

p(Yy)=p(X2y)=p(yxy) . Sorun şu ki, normal dağılımın yoğunluğunu yakın bir biçimde entegre edemiyoruz. Ama bunu ifade edebiliriz:

FX(y)=FX(y)FX(y).
Türev alma:

fX(y)=FX(y)12y+FX(y)12y.

Normal değerleri simetrik olduğundan:pdf

pdfxpdffX(y)=FX(y)1y . Bu eşitlemek normal (şimdi de olacak takılı olması Normal parçası ); ve sonunda :pdfxpdf e - x 2y pdf1ex22pdf1y

fX(y)=FX(y)1y=12πey21y=12πey2y121

Ki kare pdf ile karşılaştırın:

fX(x)=12ν/2Γ(ν2)ex2xν21

Yana için df, tam olarak elde var ki karenin. 1pdfΓ(1/2)=π1pdf

Ayrıca, prop.test()R fonksiyonunu çağırırsak, karar verdiğimiz gibi aynı testini başlatırız .χ2chisq.test()

SORU:

Bu yüzden tüm bu noktaları elde ediyorum, ancak yine de iki nedenden dolayı bu iki testin gerçek uygulaması için nasıl uygulandıklarını bilmiyorum:

  1. Bir z testi karesi alınmaz.

  2. Gerçek test istatistikleri tamamen farklıdır:

Değeri bir için test istatistikχ2 olduğu:

χ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2 burada

χ 2 O i i N E i N p i i i p i nχ2 = Asimetrik olarak bir dağılımına yaklaşan Pearson kümülatif test istatistiği . = tipi gözlem sayısı ; = toplam gözlem sayısı; = = popülasyondaki tip fraksiyonunun olduğu sıfır hipotezi ile öne sürülen tip beklenen (teorik) frekansı ; = tablodaki hücre sayısı.χ2OiiNEiNpiiipin

Öte yandan, bir testi için test istatistiği :z

p=x1Z=x1n1x2n2p(1p)(1/n1+1/n2) ile , ve "başarı" sayısı kategorik seviyelerinin her biri deneklerin sayısı üzerinden vardır değişkenler, örneğin ve . x1x2n1n2p=x1+x2n1+n2x1x2n1n2

Bu formül binom dağılımına dayanıyor gibi görünüyor.

Bu iki test istatistik net bir şekilde farklıdır, ve gerçek test istatistik yanı sıra, farklı sonuçlara neden s -değerlerinin : 5.8481için ve z testi için, burada ( teşekkür ederim, @ mark999). P için-değeri testi olan Z-testi için ise, . İki kuyruklu ve tek kuyruklu arasındaki fark: (teşekkür ederim @amoeba).2.4183 2 = 5.84817 χ 2 0.01559 / 2 = 0.007795χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795

Peki onların hangi seviyede aynı olduklarını söylüyoruz?


Ancak bunlar iki özdeş testtir. Z kare ki-kare istatistiğidir. Sütunların iki grup olduğu ve satırların "başarılı" ve "başarısız" olduğu 2x2 sıklık tablonuz olsun. Daha sonra belirli bir sütundaki ki-kare testinin beklenen frekansları, o grubun N ile çarpılan ağırlıklı (grupların N ile) ortalama sütun (grup) profilidir . Böylece, ki-kare, iki grup profilinin her biri bu ortalama grup profilinden, yani grupların profillerinin birbirinden farklarının test edilmesine eşdeğerdir, oranların z-testi.
ttnphns

Son köprüdeki örnekte , z testi istatistiğinin neredeyse karesidir, ancak tam olarak değildir ve p değerleri farklıdır. Ayrıca, yukarıdaki dinlenme istatistiklerinin formüllerine baktığınızda, hemen hemen aynı mıdır? Ya da biri diğerinin karesini? χ2
Antoni Parellada

2
'De chisq.test()kullanmayı denediniz correct=FALSEmi?
mark999

1
Gerçekten Antoni. Her iki test de Yates ile veya Yates olmadan var. Birini, diğerini onsuz hesaplayabilir misiniz?
ttnphns

1
Teşekkür ederim! (Tahmin edilebilir şekilde) haklıydınız. Yates düzeltmesi kapalıyken, biri sadece diğerinin karesidir. Soruyu biraz hızlı olmasına rağmen düzenledim. Yine de cebirsel olarak her iki test istatistiğinin aynı olduğunu (veya diğerinin karesini) kanıtlamak ve p-değerlerinin neden farklı olduğunu anlamak istiyorum.
Antoni Parellada

Yanıtlar:


12

Sütunların iki katılımcı grubu ve satırların "Evet" ve "Hayır" yanıtları olduğu 2x2 sıklık tablosuna sahip olalım. Frekansları grup içindeki oranlara , yani dikey profillere dönüştürdük :

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

Formülündeki frekanslar yerine orantıları değiştirdikten sonra bu tablonun normal (Yates düzeltilmedi) şöyle görünür:χ2

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

Unutmayın , iki profil ağırlıklı ortalama profilin elemanıveve formül takın, elde edilmesi içinp=n1p1+n2p2n1+n2(p1,q1)(p2,q2)

...=(p1p2)2(n12n2+n1n22)pqN2

Hem pay hem de paydayı ile bölün ve ( p 1 - p 2 ) 2(n12n2+n1n22)

(p1p2)2pq(1/n1+1/n2)=Z2,

"Evet" yanıtı için oranların z-testinin kare z-istatistiği.

Böylece, 2x2homojenlik Ki-kare istatistiği (ve testi) iki oranın z-testine eşdeğerdir. Belirli bir sütundaki ki-kare testinde hesaplanan beklenen frekanslar n, bu grubun çarpımıyla ağırlıklı (grup tarafından ) ortalama dikey profildir (yani "ortalama grubun" profili) n. Böylece, ki-kare, iki grup profilinin her birinin bu ortalama grup profilinden sapmasını test ettiği ortaya çıkmaktadır - bu, grupların profillerinin birbirinden farklarının test edilmesine eşdeğerdir, bu da oranların z-testi.

Bu, değişken ilişkilendirme ölçüsü (ki-kare) ile grup farkı ölçüsü (z-testi istatistiği) arasındaki bağlantının bir göstergesidir. Öznitelik ilişkilendirmeleri ve grup farklılıkları (genellikle) aynı şeyin iki yönüdür.


(Yukarıdaki ilk satırdaki genişlemeyi gösteren By @ Antoni'nin isteği):

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


χ2q

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
Antoni Parellada

@ttnphs ... Or some reference so it's less work to type the latex... And I'll promptly and happily 'accept' the answer...
Antoni Parellada

@Antoni, expansion inserted.
ttnphns

@ttnphns Awesome!
Antoni Parellada
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.