Pearson Chi Squared Testi nasıl çalışır?


18

Yakın tarihli bir oylamadan sonra Pearson Chi Squared testi hakkındaki anlayışımı kontrol etmeye çalışıyorum. Genellikle chi kare istatistiği (veya chi kare istatistiğinin azaltılması) sonuçta ortaya çıkan uyumu takmak veya kontrol etmek için kullanırım. Bu durumda, varyans genellikle bir tablo veya histogramda beklenen sayım değil, deneysel olarak belirlenmiş bir varyanstır. Her iki durumda da, testin hala multinomiyal PDF'nin asimptotik normalliğini kullandığı izlenimindeydim (yani test istatistiğim

Q=(nNm)V1(nNm)

ve burada asimptotik multinormal olan V olan) kovaryans matrisidir. Bu nedenle Q , büyük n verilen bir ki-kare dağılımına sahiptir, bu nedenle istatistiğin paydası olarak beklenen sayıların kullanılması büyük n için geçerli olur . Bunun sadece histogramlar için geçerli olması mümkündür, yıllardır küçük bir veri tablosunu analiz etmedim.(nNm)VQnn

Kaçırdığım daha ince bir argüman var mı? Bir referansla, hatta kısa bir açıklama ile ilgilenirim. (Her ne kadar mümkün olsa da, asimtotik kelimeyi atlamak için oy kullandım, ki kabul ettiğim oldukça önemli.)


χ2=i(VobsVexp)2σ2

Yanıtlar:


1

Kategorik verileri analiz etmek için ki-kare testi tasarlanmıştır. Bu, verilerin sayıldığı ve kategorilere ayrıldığı anlamına gelir. Parametrik veya sürekli verilerle çalışmaz. Bu nedenle, her durumda ortaya çıkan uyumu belirlemek işe yaramaz.

Kaynak: http://www.ling.upenn.edu/~clight/chisquared.htm


4
Bu siteye hoş geldiniz! Bunun eldeki soru ile nasıl ilişkili olduğunu anlayamıyorum. Bu cevabın muhtemelen iki yönlü beklenmedik durum tablolarının analizinden daha iyi uyum testi ile ilgili olduğunu aklınızda tutarak bu cevabı biraz genişletmek ister misiniz ?
chl

Soruyu yanlış anlamış olabilirim ama bu örnekte ki-kare testinin uygun olup olmadığını merak ediyordum. Biraz paslı olabilirim ...
BradHanks

1
Soruda açıklanan uygulama "ki kare istatistiğini kullanın ... ortaya çıkan uyumu takmak veya kontrol etmek için" dir. Rasgele bir değişkenin dağılımı, olası değerlerinin sınırlı sayıda altkümeye bölünmesi, her bir altkümeye düşen iid sonuçlarının sayısını sayarak ve birχ2Bu sayımları test edin (ki bunlar kategoriktir). Bu anlamda hem doğru hem de yanlışsınız:χ2Test sayımlarını analiz ama yine de yapar sürekli veri ile çalışmayı. BTW, "parametrik veri" anlamsız.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.