iyi-uyum testi aşağıdaki kullanır istatistiğini : o verme testte, şartlar karşılandığında, doğru olduğu verilen p-değerini hesaplamak için - dağılımı kullanılır , aynı boyuttaki temsili bir örnekte böyle bir değer gözlemlenir.χ 2 0 = n ∑ i = 1 ( O i - E i ) 2 χ2
Bununla birlikte, bir istatistik için sırayla , bir takip -Dağıtım ile ( serbestlik derecesi), doğru olması gerekir: Bağımsız, standart normal ( Wikipedia ) için . Test koşulları aşağıdaki gibidir (yine Wikipedia'dan ): χ 2 n - 1 n ∑ i = 1 ( O i - E i ) 2 Zi
- Nüfusun örnek temsilcisi
- Büyük numune boyutu
- Beklenen hücre sayısı yeterince büyük
- Her kategori arasında bağımsızlık
Koşullardan (1,2), örnekten popülasyona çıkarım koşullarını sağladığımız açıktır. (3) , paydada bulunan ayrı sayımı , her için sürekli bir dağıtıma olmadığı ve yeterince büyük değilse, Yates ile düzeltilebilecek bir hata olduğu için gerekli bir varsayım gibi görünüyor. 'düzeltme - bu, ayrık bir dağılımın temel olarak "zeminli" sürekli bir dağıtım olduğu gerçeğinden kaynaklanmaktadır, bu yüzden her biri için oranında bir değişim bunu düzeltir.Z i
(4) 'ün gerekliliği daha sonra işe yarıyor gibi görünüyor, ama nasıl olduğunu göremiyorum.
İlk başta, istatistiğin dağılımla eşleşmesi için gerektiğini . Bu beni gerçekten yanlış olan . Aslında, gelen eşitlik iki taraf için boyutun indirimden açıktır için bu durumda olamayacağını. Oi-Ei∼N(0,√nn-1
O, whuber açıklamalarından sayesinde belirgin hale gelmiştir gerek olmayan her eşit terimi, çünkü İşlevsel olarak bağımsız olan standart normal rasgele değişkenler için ( değişkenlerin sayısındaki azalmaya dikkat edin) .O i - E i χ20=∑n-1i=1Z2iZi
Benim sorum , dağılımını nasıl takip edebilir ? terimlerinin her birinin ne tür kombinasyonları kare şeklinde standart normal sonuçlanır ? Bu, görünüşe göre (ve bu mantıklı) CLT kullanımını gerektirir, ama nasıl? Başka bir deyişle , her eşittir (veya yaklaşık olarak eşittir)? χ 2 ( O i - E i ) 2 Z 2 i Zi