Bağımsızlık testi neden ki-kare dağılımını kullanıyor?


12

iyi-uyum testi aşağıdaki kullanır istatistiğini : o verme testte, şartlar karşılandığında, doğru olduğu verilen p-değerini hesaplamak için - dağılımı kullanılır , aynı boyuttaki temsili bir örnekte böyle bir değer gözlemlenir.χ 2 0 = n i = 1 ( O i - E i ) 2χ2 χ2

χ02=i=1n(OiEi)2Ei
χ2H0

Bununla birlikte, bir istatistik için sırayla , bir takip -Dağıtım ile ( serbestlik derecesi), doğru olması gerekir: Bağımsız, standart normal ( Wikipedia ) için . Test koşulları aşağıdaki gibidir (yine Wikipedia'dan ): χ 2 n - 1 n i = 1 ( O i - E i ) 2χ02χ2n1 Zi

i=1n(OiEi)2Ei=i=1n1Zi2
Zi
  1. Nüfusun örnek temsilcisi
  2. Büyük numune boyutu
  3. Beklenen hücre sayısı yeterince büyük
  4. Her kategori arasında bağımsızlık

Koşullardan (1,2), örnekten popülasyona çıkarım koşullarını sağladığımız açıktır. (3) , paydada bulunan ayrı sayımı , her için sürekli bir dağıtıma olmadığı ve yeterince büyük değilse, Yates ile düzeltilebilecek bir hata olduğu için gerekli bir varsayım gibi görünüyor. 'düzeltme - bu, ayrık bir dağılımın temel olarak "zeminli" sürekli bir dağıtım olduğu gerçeğinden kaynaklanmaktadır, bu yüzden her biri için oranında bir değişim bunu düzeltir.Z iEiZi1/2

(4) 'ün gerekliliği daha sonra işe yarıyor gibi görünüyor, ama nasıl olduğunu göremiyorum.

İlk başta, istatistiğin dağılımla eşleşmesi için gerektiğini . Bu beni gerçekten yanlış olan . Aslında, gelen eşitlik iki taraf için boyutun indirimden açıktır için bu durumda olamayacağını. Oi-EiN(0,Zi=OiEiEinn-1OiEiN(0,Ei)nn1

O, whuber açıklamalarından sayesinde belirgin hale gelmiştir gerek olmayan her eşit terimi, çünkü İşlevsel olarak bağımsız olan standart normal rasgele değişkenler için ( değişkenlerin sayısındaki azalmaya dikkat edin) .O i - E iZi χ20=n-1i=1Z2iZiOiEiEiχ02=i=1n1Zi2Zi

Benim sorum , dağılımını nasıl takip edebilir ? terimlerinin her birinin ne tür kombinasyonları kare şeklinde standart normal sonuçlanır ? Bu, görünüşe göre (ve bu mantıklı) CLT kullanımını gerektirir, ama nasıl? Başka bir deyişle , her eşittir (veya yaklaşık olarak eşittir)? χ 2 ( O i - E i ) 2χ02χ2 Z 2 i Zi(OiEi)2EiZi2Zi


1
belirttiğiniz son şeyi aldığını nereden okuduğunuzu merak ediyorum ( ). Bu gerekli değildir: istatistiği, normal bir dağılıma sahip olan bu standart artıklardan herhangi biri olmadan dağılımına (en azından son derece iyi bir yaklaşımla) sahip olabilir. Sormak istediğiniz soru, bu varsayımların istatistiğinin dağılımına atıfta bulunmayı nasıl haklı gösterdiği ? Kendi başlarına yapmazlar. Neyin yanlış gidebileceğiyle ilgili bir tartışma için, lütfen stats.stackexchange.com/a/17148 adresindeki gönderime bakın . χ2χ2χ2χ2OiEiN(0,Ei)χ2χ2χ2χ2
whuber

1
İki toplam karenin eşitliğinden kare köklerin terim olarak eşit olduğu sonucuna varamazsınız! Bu sadece sayılar için olduğu için, rastgele değişkenler için de geçerlidir.
whuber

1
Varsayalım, bu beton yapmak için edilir , bağımsız bir şekilde dağıtılmış serbestlik derecelerine sahip olan dağılımları ve bu ancak tüm için . Daha sonra hiçbiri normal da bir dağılımına sahiptir. χ ν 1 , ν 2 , , ν n ν 1 + ν 2 + + ν n = n - 1 ν i1 i W i n i = 1 W 2 i χ 2 ( n - 1 )(Wi),i=1,,nχν1,ν2,,νnν1+ν2++νn=n1νi1iWii=1nWi2χ2(n1)
whuber

1
Eğer "kare standart normal" ile "bağımsız kare standart normallerin toplamı" demek istiyorsanız, bu gerçekten başlangıçta poz vermek istediğinize inandığım sorudur :-). Ve sonunda, durumun en analizler standardize artıklar asimptotik (serbestlik derecesi neden olan, ama oldukça bağımsız değildir, normal standart olduğunu kanıtlamak için Merkezi Limit Teoremi çağırmak Aslında çıkıyor ve ). nn1n
whuber

1
Beklediğim için +1 yakında çok iyi bir soru olacak. İlk sorun, bağımsızlık testinin iddia edilen istatistiği kullanmamasıdır. Başlangıçta verilen istatistik tek boyutludur ( kategoriye göre bir toplam ), bağımsızlık testi birden fazla değişken gerektirir. Testin ismini ve istatistiği uygun hale getirmek için lütfen düzenleyin. n
Glen_b-Monica

Yanıtlar:


6

XλXλ

(Xλ)2λ
z2

z2

izi2=ZIZ

ZQZ
Q

i(ziz¯)2

Üzgünüm, ama beni kesinlikle "Bunun yerine, sen ..." de kaybettin
VF1

@ VF1, bir değişiklik yaptım, umarım daha açıktır. Cochrane teoremi, içinde normalleri olan karelerin toplamının ki kare dağılımına sahip olduğu sorusunun cevabıdır.
Placidia

1
Tamam, buna bir göz atacağım. Başka birinin ekleyeceği bir şey olması durumunda soruyu açık bırakacağım.
VF1

1
Normalde numune boyutu sabittir. Bu, girişlerin herhangi birinin bir Poisson dağılımını takip etmesinin imkansız olduğu anlamına gelir. Bu nedenle bir Poisson dağılımına itiraz sadece başka bir yaklaşım gibi görünüyor ve bizi başladığımız yerde bırakıyor gibi görünüyor.
whuber

1

χ2

Zi=OiEiEi

aslında kaynaklı

OiEi(StandardErrorOfTheObserved)

(StandardErrorOfTheObserved)EiZi=OiEiEi

Her neyse, formun test istatistiklerini oluşturabilirsiniz

Z=|Z1|+|Z2|+|Z3|+...

χ2=Z12+Z22+Z32+...

χ2χ2

χ2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.