Ki kare testi ile eşit oranlarda test arasındaki ilişki nedir?


52

Diyelim ki dört, birbirini dışlayan özelliklere sahip üç popülasyonum var. Her popülasyondan rastgele örnekler alıyorum ve ölçtüğüm özellikler için bir çapraz tablo veya frekans tablosu yapıyorum. Bunu söylerken doğru mu:

  1. Eğer popülasyonlar ve özellikler arasında bir ilişki olup olmadığını test etmek istersem (örneğin, bir popülasyonun özelliklerden birinin frekansının daha yüksek olup olmadığı), ki-kare testi yapmalı ve sonucun anlamlı olup olmadığını görmeliyim.

  2. Ki-kare testi önemliyse, bana sadece popülasyonlar ve özellikler arasında bir ilişki olduğunu gösterir, ancak nasıl ilişkili olduklarını göstermez.

  3. Ayrıca, tüm özelliklerin popülasyonla ilgili olması gerekmez. Örneğin, eğer farklı popülasyonlar, A ve B karakteristiklerinin belirgin şekilde farklı dağılımlarına sahipse, ancak C ve D'den farklı ise, o zaman ki-kare testi hala önemli olarak geri gelebilir.

  4. Eğer belirli bir özelliğin popülasyondan etkilenip etkilenmediğini ölçmek istersem, o zaman o özellik üzerinde eşit oranlar için bir test yapabilirim (bunu z-testi olarak adlandırdım ya da olduğu prop.test()gibi R).

Başka bir deyişle, prop.test()ki-kare testi anlamlı bir ilişki olduğunu söylerken, iki kategori grubu arasındaki ilişkinin niteliğini daha doğru belirlemek için kullanılması uygun mudur?


Yanıtlar:


23

Çok kısa cevap:

Ki-kare testi ( chisq.test()R cinsinden), beklenmedik durum tablosunun her kategorisindeki gözlemlenen frekansları beklenen frekanslarla karşılaştırır (marjinal frekansların ürünü olarak hesaplanır). Gözlenen ve beklenen sayılar arasındaki sapmaların şansa atfedilemeyecek kadar büyük olup olmadığını belirlemek için kullanılır. Bağımsızlıktan ayrılma artıkları inceleyerek kolayca kontrol edilebilir (deneyin ?mosaicplotveya ?assocplotaynı zamanda vcdpakete de bakın ). fisher.test()Kesin bir test için kullanın (hipergeometrik dağılımına dayanarak).

prop.test()R fonksiyon oranlar grubu arasında karşılaştırılabilir veya teorik olasılıklar farklı değildir olmadığını test etmeye imkan vermektedir. testi olarak adlandırılır, çünkü test istatistiği şöyle görünür:z

z=(f1f2)p^(1p^)(1n1+1n2)

burada ve indeksler tablonuzun birinci ve ikinci satırına işaret eder. İki yönlü acil durum tablosunda , bu sıradan testiyle karşılaştırılabilir sonuçlar vermelidir :p^=(p1+p2)/(n1+n2)(1,2)H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

R ile ayrık verilerin analizi için, Laura Thompson'dan Agresti's Kategori Veri Analizi'ne (2002) Eşlik Eden R (ve S-PLUS) El Kitabı'nı kesinlikle tavsiye ederim .


2
Prop.test () işlevinin gerçekleştirdiği test için ortak bir ad var mı?
Atticus29

2
"Z testi" olarak anılır ".
russellpierce

Düşündüm - @chl biraz karıştı olduğum prop.testve chisq.testhem bu yazı özdeş p değerleri açıklıyor kare chi-, yanı sıra neden kullanmak R-Blogcular kendi ad hoc fonksiyonu var.
Antoni Parellada

@Antoni Evet, Keith'in cevabında anlattığı şey bu.
chl

3
neyin ve , , , , ? n 2 f 1 f 2 p 1 p 2n1n2f1f2p1p2
tomka

23

İki oranın eşitliği için ki-kare testi, testi ile tamamen aynıdır . Bir serbestlik dereceli ki-kare dağılımı sadece normal bir sapma-karedir. Temel olarak, beklenmedik durum tablosunun bir alt kümesinde ki-kare testini tekrarlıyorsunuz. (Bu yüzden @chl , her iki testte de aynı değerini alır .)pzp

Küresel olarak ki-kare testi yapmanın ve sonra alt kümeler üzerinde daha fazla test yapmak için dalmanın problemi, alfaınızı korumak zorunda kalmayacağınızdır - yani, yanlış pozitifleri% 5'ten az olacak şekilde kontrol etmeyeceksiniz (veya Tüm deney boyunca ne olursa olsun )α

Bence bunu klasik paradigmada düzgün yapmak istiyorsanız, hipotezlerinizi başlangıçta tanımlamanız (karşılaştırılacak oranlar), verileri toplamanız ve ardından her testin toplamının eşik değeri için toplam eşik değerinin test edilmesi gerektiği hipotezlerini test etmeniz gerekir. için . Tabi bir bağıntı olduğunu kanıtlayamazsan .α

Oranların eşitliği için en güçlü teste Barnard'ın üstünlük testi denir .


@ biraz kafam karıştı - düşündüm prop.testve chisq.testher ikisi de aynı p değerlerini açıklayabilecek ki-kare kullandım, ayrıca R-Blogger’daki bu yazıdaki neden kendi özel işlevlerine sahip olduklarını düşündüm .
Antoni Parellada

Kafanı karıştıran şeyin ne olduğunu anlamıyorum, @AntoniParellada. Bu cevap, “her ikisi de ki-kareyi kullanırsa” anlam ifade eden “tamamen aynı” olduklarını belirtir.
dediklerinin - Monica Yeniden

Asıl cevabın prop.test()içindeki ifade, chl ... 'in zıtlık içinde z testi olarak adlandırıldığını ifade eder chisq.test(). Daha sonra Keith, “İki oranın eşitliği için ki-kare testi, z-testi ile tamamen aynıdır. (Bu yüzden @chl, her iki testte de aynı p-değerini alır.)”
Antoni Parellada

1
Bu sadece inanılmaz bir ifadeyle, @AntoniParellada gibi görünüyor. Kavramsal olarak, iki test farklı, bu da gördüğüm diğer cevabımda bahsettiğim şeydi. Fakat matematiksel olarak eşdeğerdirler. Aslında, R fonksiyonunun prop.test()aslında sadece chisq.test()çıkışı çağırıp çağırdığını düşünüyorum .
gung - Reinstate Monica

@gung R-Blogger'lara benzeyen bir fonksiyon üzerinde çalışıyordum ve başlangıç ​​seviyemdeki insanlar için bir yazı yazacaktım, aslında yazdığınız birkaç anahtar kavramla ilgili olarak sizi alıntı yaparak ikisini de chi için yazdıracağım. kare ve z testi ve ardından R kodunun verilmesi.
Antoni Parellada
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.