3 örnekle oranların eşitliği için hipotez testi


9

Ben iki sütun ile cep telefonu müşteri bilgi veri bir veri kümesi var. İlk sütun, bir hesabın (A, B veya C) dahil olduğu belirli kategoriyi içerir ve ikinci sütun, bu hesabın iptal edilip edilmediğine ilişkin ikili değerlidir. Örneğin

A | cancelled
C | active
B | active
A | cancelled

yapmak istediğim, A, B ve C tipi hesapların oranının aktif hesaplar için iptal edilen hesaplara göre farklı olup olmadığını test etmek için bir çeşit hipotez testi yapmaktır - sıfır hipotezi aynıdır. Yani bu 3 değer için nasıl yapacağımı bilmiyorum hariç oranlar için bir hipotez testi gibi


6
Kullanabilirsiniz χ2Üç grup arasındaki oranların eşitliğini test etmek için test.

Ayrıca farklı olup olmadıklarını görmek için A vs B, B vs C ve A vs C olmak üzere üç hipotez testi yapabileceğimi düşünüyorum
user1893354

5
Yapabilirsiniz, ancak daha sonra çoklu karşılaştırma problemlerini düzeltmeniz gerektiğini unutmayın.

Cevabınız için teşekkür ederim. Birden fazla karşılaştırma problemiyle ne demek istediğini merak ediyorum. Veya daha spesifik olarak, üç hipotez test yönteminin neden dezavantajlı olduğu. Teşekkürler!
user1893354

3
Üç hipotez testi kullanmada iki problem vardır. İlk olarak, birbirlerine bağımlıdırlar çünkü her çift bazı verileri yeniden kullanır. İkincisi, eğer gerçekten bağımsızlarlarsa, o zaman en azından birinin null doğru olsa bile anlamlı olma şansı - yani, yanlış pozitif hata şansı - istenen yanlıştan neredeyse üç kat daha büyük olurdu pozitif oran. İkinci sorun testin ayarlanması gerektiğini gösterir, ancak birincisi uygun ayarlamanın bulunmasının sorunlu olabileceğini gösterir. χ2yaklaşımı bu sorunları önler.
whuber

Yanıtlar:


13

Genel olarak cevabımı temel alacağım ve probleminizin test çerçevesine nasıl uyduğuna dair yorumlar ekleyeceğim. Genel olarak, oranların eşitliğini birχ2 tipik sıfır hipotezinin nerede olduğunu test eder, 'H0, takip ediliyor:

'H0:p1=p2=...=pk

yani, tüm oranlar birbirine eşittir. Şimdi sizin durumunuzda sıfır hipotezi aşağıdaki gibidir:

'H0:p1=p2=p3
ve alternatif hipotez
'Hbir: derhal pben için farklı ben=1,2,3

Şimdi yapmak için χ2 test Aşağıdaki test istatistiğini hesaplamamız gerekir: Test istatistiğinin değeri

χ2=Σben=1n(Öben-Eben)2Eben

nerede

  • χ2 = Asimptotik olarak bir kanala yaklaşan Pearson kümülatif test istatistiği χ2 dağıtım
  • Öben = gözlemlenen frekans
  • Eben = sıfır hipotezi ile öne sürülen beklenen (teorik) sıklık
  • n = tablodaki hücre sayısı

Senin durumunda n=6 çünkü bu sorunu aşağıdaki tablo olarak düşünebiliriz: resim açıklamasını buraya girin

Test istatistiğine sahip olduktan sonra, hipotez testimizi tamamlamak için nasıl devam edeceğimiz konusunda iki seçeneğimiz var.

Seçenek 1) Test statikimizi karşılaştırabilirizχ2sıfır hipotezi altında uygun kritik değere. Yani, eğer'H0 doğru, sonra bir χ2 bir beklenmedik durum tablosundan istatistik R, satırlar ve C sütunlarda bir χ2 ile dağıtım (R,-1)x(C-1)özgürlük derecesi. Kritik değerimizi hesapladıktan sonraχ* eğer sahipsek χ2>χ*sonra sıfır hipotezini reddedeceğiz. Açıkçasıχ2χ* sonra sıfır hipotezini reddedemeyiz.

Grafiksel olarak (tüm sayılar yapılır) bu şudur: resim açıklamasını buraya girin

Grafikten, eğer test istatistiğimiz χ2 mavi test istatistiğine karşılık gelirse, bu test istatistiği kritik bölge içerisine girmediği için sıfır hipotezini reddedemeyiz (ör. χ2<χ*). Alternatif olarak, yeşil test istatistiği kritik bölgenin içine girer ve bu nedenle yeşil test istatistiğini hesaplamış olsak sıfır hipotezini reddederiz.

Örneğinizde, serbestlik dereceleriniz

df=(R,-1)x(C-1)=(2-1)x(3-1)=1x2=2

Seçenek 2) null hipotezi altında test istatistiği ile ilişkili p değerini hesaplayabiliriz ve bu p değeri belirtilenlerden daha düşükseα-se o zaman sıfır hipotezini reddedebiliriz. P değeri,α- o zaman sıfır hipotezini reddedemeyiz. P-değerinin,χ(R,-1)x(C-1)2 dağılım test istatistiğinden daha büyüktür.

Grafiksel olarak resim açıklamasını buraya girin

burada p değeri, test istatistiğimizden daha büyük olan alan olarak hesaplanır (örnekteki mavi gölgeli alan).

Yani, eğer α>p-değeri sonra sıfır hipotezini reddetmek 'H0, Başka,

Eğer αp-değeri sıfır hipotezini reddet 'H0

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.