Beklenmedik tablolar: ne tür testler ne zaman yapılır?


17

Eski chi-sq ve Fisher'ın kesin test tartışmasına ilişkin bu tartışmanın bir uzantısını görmek istiyorum , kapsamı biraz genişletiyoruz. Bir beklenmedik durum tablosunda, başımı döndürmek için yeterli olan birçok test var. Hangi testi ve ne zaman kullanmam gerektiğine dair bir açıklama ve tabii ki bir testin neden diğerine tercih edilmesi gerektiğine dair bir açıklama almayı umuyorum.

Şu anki sorunum klasik davası, ancak daha fazla boyutsallık ile ilgili cevaplar ve en azından R'de çeşitli çözümlerin uygulanması için ipuçları, en azından nasıl devam edileceği açık olmadığı durumlarda bekliyoruz.n×m

Aşağıda farkında olduğum tüm testleri listeledim; Umarım hatalarımı açığa çıkararak düzeltilebilirler.

  • . Eski bekleme. Burada üç ana seçenek var:χ2

    • 2x2 tabloları için R'de yerleşik düzeltme: "bir yarısı tüm farklılıklarından çıkarılır ." Bunu hep yapmalı mıyım?|OE|
    • " " χ 2 Test, bunu R dilinde nasıl yapacağınızdan emin değilim.N1χ2
    • Monte Carlo simülasyonu. Bu her zaman en iyisi mi? Bunu yaptığımda neden R bana df vermiyor?
  • Fisher kesin testi .

    • Herhangi bir hücrenin <4 olması beklendiğinde geleneksel olarak tavsiye edilir, ancak görünüşe göre bazıları bu tavsiyeye itiraz eder.
    • Marjinallerin sabit olduğu varsayımı (genellikle yanlış) gerçekten bu testteki en büyük problem midir?
  • Barnard'ın kesin testi

    • Başka bir kesin test, daha önce hiç duymadım.
  • Poisson regresyonu

    • Beni glms ile ilgili her zaman şaşırtan bir şey, tam olarak bu önem testlerinin nasıl yapılacağıdır, bu yüzden bu konuda yardım takdir edilecektir. İç içe model karşılaştırması yapmak en iyisi midir? Belirli bir öngörücü için bir Wald testi ne olacak?
    • Gerçekten her zaman Poisson regresyonu yapmalı mıyım? Bu ve testi arasındaki pratik fark nedir ?χ2

Yanıtlar:


13

Bu iyi bir soru, ama büyük bir soru. Tam bir cevap verebileceğimi sanmıyorum, ama düşünce için biraz yiyecek atacağım.

İlk olarak, üst mermi noktanızın altında, bahsettiğiniz düzeltme Yates'in süreklilik düzeltmesi olarak bilinir . Sorun, ayrı bir çıkarımsal istatistik hesaplamamızdır :
(Kesin bir durumdur, çünkü bir olasılık tablosunda temsil edilen yalnızca sınırlı sayıda örnekle, bu istatistiğin üstlenebileceği sınırlı sayıda olası gerçekleşmiş değer vardır.) Bu gerçeğe rağmen,sürekli birreferans dağılımı (yani.,χ2dağıtımserbestlik derecesi ile(r-1)(c-1)). Bu mutlaka bir düzeyde uyuşmazlığa yol açar. Özellikle küçük bir veri seti ile ve bazı hücrelerin 5'ten az beklenen değerleri varsa, p-değerinin çok küçük olması mümkündür. Yates'in düzeltmesi bunu ayarlar.

χ2=(OE)2E

χ2 (r1)(c1)

İronik olarak, aynı temel sorun (ayrık-sürekli uyumsuzluk) çok yüksek p değerlerine yol açabilir . Özellikle, p-değeri geleneksel olarak aşırı veya daha fazla veri alma olasılığı olarak tanımlanır gözlemlenen verilerden daha yüksek . Sürekli verilerle, herhangi bir kesin değer elde etme olasılığının kaybolan küçük olduğu ve bu nedenle gerçekten daha aşırı veri olasılığına sahip olduğumuz anlaşılmaktadır. Bununla birlikte, ayrık verilerle, tıpkı sizinki gibi veri alma konusunda sınırlı bir olasılık vardır. Yalnızca verilerin sizinkinden daha aşırı elde edilme olasılığının hesaplanması çok düşük nominal p-değerleri verir (artan tip I hatalarına yol açar), ancak verilerinizle aynı veri alma olasılığını dahil etmek, çok yüksek nominal p-değerlerine yol açar (bu da tip II hataların artmasına neden olur). Bu gerçekler ortadaki p değeri fikrini doğurur . Bu yaklaşımda, p değeri, verilerin sizinkinden daha fazla ve yarıdan daha fazla olma olasılığıdır veri olasılığı sizinkiyle aynıdır.

İşaret ettiğiniz gibi, olasılık tablosu verilerini test etmek için birçok olasılık vardır. Çeşitli yaklaşımların artı ve eksilerinin en kapsamlı tedavisi burada . Bu kağıt 2x2 tablolara özgüdür, ancak durum tablosu verileri için seçenekler hakkında daha fazla bilgi edinebilirsiniz.

Bence modelleri ciddiye almaya değer. Chi-squared gibi daha eski testler hızlı, kolay ve birçok kişi tarafından anlaşılır, ancak uygun bir model oluştururken elde ettiğiniz verilerin kapsamlı bir şekilde anlaşılmasını sağlamaz. Acil durum tablonuzdaki satırları [sütunları] bir yanıt değişkeni olarak ve sütunları [satırları] açıklayıcı / yordayıcı değişkenler olarak düşünmek mantıklıysa, bir modelleme yaklaşımı kolayca izlenir. Örneğin, sadece iki satırınız varsa, lojistik regresyon modeli oluşturabilirsiniz; birkaç sütun varsa, ANOVA tipi bir model oluşturmak için referans hücre kodlamasını (kukla kodlama) kullanabilirsiniz. Öte yandan, ikiden fazla satırınız varsa, çok terimli lojistik regresyon aynı şekilde kullanılabilir. Satırlarınızın gerçek bir düzeni varsa, sahipse sıralı lojistik regresyon multinomiyalden daha üstün performans sağlar. Benim görüşüme göre, log-lineer model (Poisson regresyonu), ikiden fazla boyutu olan beklenmedik durum tablolarınız olmadığı sürece muhtemelen daha az ilgilidir.

Bu gibi konuların kapsamlı bir tedavisi için en iyi kaynaklar Agresti'nin kitaplarıdır: ya tam ölçekli tedavisi (daha titiz), giriş kitabı (daha kolay ama yine de kapsamlı ve çok iyi) ya da muhtemelen sıra kitabı .

G2-test

G2=Oln(OE)


1
Bu, altta yatan sorunun büyük bir açıklamasıydı, teşekkürler! Ayrıca geçmişte Agresti'nin metninin harika bir kaynak olduğu söylendi, bu yüzden kontrol edeceğim.
JVMcDonnell

4

Bazı sorularınızı benim açımdan elimden geldiğince ele almaya çalışacağım. İlk olarak Fisher-Irwin Testi, Fisher'ın kesin testi için başka bir isim. Bazen hesaplama açısından yoğun olması dışında genellikle Fisher testini kullanmayı tercih ederim. Bu testle ilgili herhangi bir sorun varsa, marjinal toplamları şartlandırır. Testin güzelliği, sıfır hipotezi altında, gözlemlenen tablo ile aynı marjinal toplamlara sahip beklenmedik durum tabloları kümesinin hipergeometrik dağılıma sahip olmasıdır. Bazı insanlar, aynı marjinal toplamlara sahip tabloları göz önünde bulundurmanın gerekçesini görmediklerini iddia ediyorlar.

Acil durum tablolarında ilişkilendirmeyi test etmek için Pearson ki-kare testi çok yaygın olarak kullanılır. Diğer birçok test gibi yaklaşık değerlerdir ve bu nedenle önem seviyesi her zaman doğru değildir. Cochran, bazı örneklerde çok seyrek olduğunda (örn. Bazı hücrelerde 5'ten az vaka içeren) küçük örneklerde yaklaşıklığın zayıf olacağını gösterdi.

Diğer birçok yaklaşık test vardır. Tipik olarak Fisher testini SAS kullanarak uygularken tüm bu testlerin sonuçlarını alıyorum ve genellikle hemen hemen aynı sonuçları verirler. Ancak Fisher testi her zaman marjinal toplamlara bağlıdır.

Poisson regresyonu ile ilgili olarak, kategorik değişkenleri hücre toplamlarıyla ilişkilendiren bir modeldir. Herhangi bir model gibi, bir dizi varsayımlara bağlıdır. En önemlisi, hücre sayımlarının bir Poisson dağılımını izlemesidir, bu da ortalama sayımların varyansına eşit olduğu anlamına gelir. Bu genellikle hücre sayısı dağılımları için geçerli değildir. Aşırı dağılım durumunda (ortalamadan büyük varyans) negatif bir binom modeli daha uygun olabilir.


"Fisher-Irwin Testi Fisher'in kesin testi için başka bir isim" ... aha, bu yorum bana daha az kafa karıştırıcı geliyor, teşekkürler!
JVMcDonnell

3
Cevabınız, bu şeyleri ne zaman yapacağım konusundaki karışıklığımı gerçekten azaltmadı. Sanırım duymayı umduğum şeylerden biri, chi ^ 2 ile ilgili sorunların monte carlo simülasyonu veya düzeltmeleri vb. ya da glms tarafından ne ölçüde geçebileceğini. Daha fazla ısırık alıp alamayacağımı görmek için bunu biraz açık bırakacağım. Ama biraz sonra kimse tartmazsa cevabınızı kabul edeceğim.
JVMcDonnell

Fisher ve Chi-square için sanırım chi square'i ne zaman kullanabileceğinizi söyledim. Fisher'in her zaman marjinal toplamları şartlandırmanız gerektiği fikrini kabul ederseniz, Fisher testi her zaman geçerlidir. Ama bunu kabul etmezseniz, koşulsuz bir test seçmeniz gerektiğini düşünüyorum. Mevcut testlerin diğer pili gelince ben özellikleri hakkında hiçbir şey bilmiyorum ve bu nedenle gerçekten onları ne zaman kullanmak için tavsiye edemez. Form deneyimi Sonuçların genellikle yakın olduğu için önemli olduğu vakaları gördüm.
Michael R.Chernick

Fisher'ın "her zaman marjinal toplamları şartlandırmalısınız" diye düşündüğü gerçekten doğru mu? Bu varsayım sadece marjinal toplamlar sabit olduğunda geçerlidir. Çay tadımı yapan bayan örneğinde, bayan 5'in önce süt ve 5'inin son süt olduğunu biliyor. Ancak deneylerde marjinalleri zorlayan bir kuvvet olmadığı daha yaygındır. Her biri 10 kez iki jeton çevirme durumunu düşünün. Sikke etrafında 5 kafa yuvarlandığında marjinalleri korumak için kuyruk vermeye başlamaz. Bu gibi durumlarda Fisher'in oldukça muhafazakar olduğu belgelenmiştir. Bu yüzden alternatiflerle ilgileniyorum.
JVMcDonnell

Evet. Anladığım kadarıyla Fisher verilen verilerden bilgi kullanan referans dağılımları seçtiğine inandı. Bu nedenle, marjinal toplamların gözlemlenen verilerinizden nasıl geldiği önemli değil, sadece verilerdeki kısıtlamaları, yani verilen marjinal toplamları izleyen sıfır hipotezi altında gerçekleşecek verilerle karşılaştırılması gerektiğini düşünür. Fisher'ın sahip olduğu diğer fikirlerde olduğu gibi bu da tartışmalıdır.
Michael R.Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.