Bir olasılık oranı testi neden ki-kare olarak dağıtılmıştır?


34

Test testi neden ki-kare testine tabi tutuluyor?

2(ln Lalt modelln Lnull model)χdfaltdfnull2



14
Referans için teşekkürler. İşte benden biri: stats.stackexchange.com/faq#etiquette
Dr. Beeblebrox

5
Buradaki "Mizah duygunuzu getirin" i dikkat edin. Kaba olmak istememiştim, ancak bu sorunun cevabı nispeten sıkıcı olacak ve temel olarak bu makalenin içeriğinden (veya daha iyi istatistik ders kitaplarından bazılarından) oluşacaktı. Bunlardan birindeki açıklama ile ilgili kesin probleminizi belirtirseniz, size yardımcı olmaktan memnuniyet duyarım.
Nick Sabbe

2
Wilks'in orijinal kağıdına doğrudan ödemeli bağlantı.
ayorgo

Yanıtlar:


23

@ Nick tarafından belirtildiği gibi, bu Wilks teoreminin bir sonucudur . Ancak, test istatistiğinin asimptotik olarak dağıtıldığını, dağıtıldığını unutmayın.χ 2χ2χ2

Bu teoremden çok etkilendim çünkü çok geniş bir bağlamda duruyor. Olabilirlik ile istatistiksel bir model göz önünde olduğu vektör gözlemler parametresi ile bir dağılımdan bağımsız çoğaltılmış gözlemler bir alt manifoldu ait arasında ile boyut . boyutunda bir altmanifold izin verin . testini ilgilendiğinizi düşünün .y n θ B 1 R, d dim ( B 1 ) = s B 0B 1 loş ( B 0 ) = m * H 0 : { θ B 0 }l(θy)ynθB1R,dkarartmak(B1)=sB0B1karartmak(B0)=m'H0:{θB0}

Olasılık oranı olan Sapmayı tanımlayın . Daha sonra Wilks teoremi söylüyor, normal düzenlilik varsayımlar altında, asimptotik bir ile -Dağıtık zaman serbestlik derecesi geçerlidir.d(y)=2log(lr(y))d(y)χ2s-m, H0

lr(y)=yudumθB1l(θ|y)yudumθB0l(θ|y).
d(y)=2günlük(lr(y))d(y)χ2s-m'H0

Wilk'in @Nick tarafından belirtilen orijinal makalesinde kanıtlanmıştır . Bence bu yazının okunması kolay değil. Wilks daha sonra belki de teoreminin en kolay sunumuyla bir kitap yayınladı. Williams'ın mükemmel kitabında kısa bir buluşsal kanıt .


3
Sad teoremi belirtilen olmadığını Samuel S. Wilks adanmış wikipedia sayfası
Stéphane Laurent

5
Oh hadi Stephane. Bu Vikipedi, düzenleyebilir ve geliştirebilirsiniz!
StasK

1
@StasK Bunu biliyorum ama hiç denemedim. Ve zaten hayatımın çok fazla zamanını istatistik ve matematikle geçiriyorum;)
Stéphane Laurent

2'nin neden sapma tanımında kütüğün önünde olduğuna dair bir sezgi var mı?
user56834

@ Programmer2134 İkinci mertebe taylor genleşmesinden türetilmiştir.
Frank Vel

25

Nick Sabbe'nin sert yorumunu ikinci olarak söylüyorum ve kısa cevabım öyle değil . Yani, sadece normal lineer modelde. Kesinlikle başka türlü bir koşul için tam dağılım bir . Birçok durumda, daha sonra Wilks teoremi koşulları yerine getirdiğinin umut ve olabilir asimptotik için dağıtımında log-olabilirlik oran testi istatistik yakınlaşıyor . Wilks teoreminin koşullarının sınırlamaları ve ihlalleri ihmal edilemez.χ 2χ2χ2

  1. Teoremi, iid data zaman serisi veya eşit olmayan olasılık anketi örnekleri gibi bağımlı verilerle ilgili sorunlar beklediğini varsayar (olasılıklar zayıf bir şekilde tanımlanmıştır), durum tablosunda bağımsızlık testleri gibi "normal" testleri , toplam olarak davranmaya başlayın ( Rao & Scott ) .Iid verileri için, , ve toplam . bağımsız veri, bu artık böyle değil.χ 2 Σ k bir k v k , v k ~ iid χ 2 1 bir k = 1 χ 2χ2Σkbirkvk,vk~iidχ12birk=1χ2
  2. Teorem, gerçek parametrenin parametre alanının içinde olduğunu varsayar. Çalışılacak Öklid alanınız varsa, bu sorun değil. Bununla birlikte, bazı problemlerde, varyans 0 veya -1 ile 1 arasındaki korelasyon gibi doğal kısıtlamalar ortaya çıkabilir . Eğer gerçek parametre bir sınır ise, o zaman asimptotik dağılım farklı derecelerde bir karışımıdır. Özgürlüğün, testin cdf'sinin bu cdfs'lerin toplamı olduğu anlamında ( Andrews 2001 , artı aynı dönemdeki makalelerinin iki ya da üçü daha, tarihin Chernoff 1954'e geri dönmesiyle ).ki-kare 2χ2
  3. Teorem, ilgili tüm türevlerin sıfır olmadığını varsayar. Buna bazı doğrusal olmayan problemler ve / veya parametreleştirmeler ve / veya boş değer altında bir parametre tanımlanmadığında durumlarla mücadele edilebilir. Bir Gauss karışım modeline sahip olduğunuzu ve boş değerinizin bir bileşen ve iki ayrı bileşen seçeneğinin bir karışım fraksiyonuyla . Boş değer, alternatif olarak iç içe yerleştirilmiştir, ancak bu, çeşitli şekillerde ifade edilebilir: (bu durumda parametreleri belirlenmez), (bu durumdaf N ( μ 1 , σ 2 1 ) + ( 1 - f ) N ( μ 2 , σ 2 2 ) f f = 0 μ 1 , σ 2 1 f = 1 μ 2 , σ 2 2 μ 1 = μ 2 , σ 1N-(μ0,σ02)fN-(μ1,σ12)+(1-f)N-(μ2,σ22)ff=0μ1,σ12f=1μ2,σ22tanımlanmadı) veya (bu durumda tanımlanmadı). Burada, yerleştirmeyi nasıl parametrelediğinize bağlı olarak farklı kısıtlamalarınız olduğundan, testinizde kaç derece serbestlik olması gerektiğini bile söyleyemezsiniz. Bu konuda Jiahua Chen'in çalışmasına bakınız, örneğin CJS 2001 . fμ1=μ2,σ1=σ2f
  4. dağıtım doğru belirtilmişse Tamam çalışabilir. Fakat değilse, test tekrar bozulur. Yapısal eşitlik kovaryansı modellemesi olarak bilinen çok değişkenli analizin (büyük oranda istatistikçiler tarafından ihmal edilen) alt alanında, çok değişkenli normal bir dağılım genellikle kabul edilir, ancak yapı doğru olsa bile, dağılım farklıysa test yanlış yapar. Satorra ve Bentler 1995 , dağıtımın , benim açımdan bağımsız olmayan verilerle aynı öyküye gösteriyor, ancak aynı zamanda s modelin yapısına ve dağılımın dördüncü anlarına bağlıdır.k a k v k , v kiid χ 2 1 a kχ2Σkbirkvk,vk~iidχ12ak
  5. Sonlu örnekler için, büyük bir sınıfta olasılık oranı Bartlett ile düzeltilebilir : süre büyüklükte bir örnek için ve dağılım fonksiyonu olarak normal olabilirlik sorunları için, dağıtım, bir sabit bulabilirsiniz öyle ki , yani daha yüksek bir dereceye doğruluk. Böylece sonlu örnekler için yaklaşımı iyileştirilebilir (ve nasıl yapılacağını biliyorsanız, muhtemelen iyileştirilmesi gerekir). Sabitn, F ( x , χ 2 d ) χ 2 d b p r O , b [ d ( y ) / ( 1 + b / n )Prob[d(y)x]=F(x;χd2)[1+O(n-1)]nF(x;χd2)χd2bχ 2 bPrOb[d(y)/(1+b/n)x]=F(x;χd2)[1+O(n-2)]χ2b modelin yapısına ve bazen yardımcı parametrelere bağlıdır, ancak tutarlı bir şekilde tahmin edilebilirse, kapsama sırasının iyileştirilmesinde de işe yarar.

Bu ve benzeri ezoterik sorunların olasılık çıkarımında gözden geçirilmesi için, bkz. Smith 1989 .


1
Teşekkürler! Çok öğretici. Ne demek "sadece normal doğrusal modelde" ? ve doğrusal alt uzaylar olduğunda bir Fisher testi için sapma, Fisher istatistiğinin monoton bir fonksiyonudur ve sadece asimptotik olarak . B 1 χ 2B0B1 χ2
Stéphane Laurent

Bilinen varyansı ile eklemeliyim.
StasK
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.