Bu iyi bir soru, ama büyük bir soru. Tam bir cevap verebileceğimi sanmıyorum, ama düşünce için biraz yiyecek atacağım.
İlk olarak, üst mermi noktanızın altında, bahsettiğiniz düzeltme Yates'in süreklilik düzeltmesi olarak bilinir . Sorun, ayrı bir çıkarımsal istatistik hesaplamamızdır :
(Kesin bir durumdur, çünkü bir olasılık tablosunda temsil edilen yalnızca sınırlı sayıda örnekle, bu istatistiğin üstlenebileceği sınırlı sayıda olası gerçekleşmiş değer vardır.) Bu gerçeğe rağmen,sürekli birreferans dağılımı (yani.,χ2dağıtımserbestlik derecesi ile(r-1)(c-1)). Bu mutlaka bir düzeyde uyuşmazlığa yol açar. Özellikle küçük bir veri seti ile ve bazı hücrelerin 5'ten az beklenen değerleri varsa, p-değerinin çok küçük olması mümkündür. Yates'in düzeltmesi bunu ayarlar.
χ2=∑(O−E)2E
χ2 (r−1)(c−1)
İronik olarak, aynı temel sorun (ayrık-sürekli uyumsuzluk) çok yüksek p değerlerine yol açabilir . Özellikle, p-değeri geleneksel olarak aşırı veya daha fazla veri alma olasılığı olarak tanımlanır gözlemlenen verilerden daha yüksek . Sürekli verilerle, herhangi bir kesin değer elde etme olasılığının kaybolan küçük olduğu ve bu nedenle gerçekten daha aşırı veri olasılığına sahip olduğumuz anlaşılmaktadır. Bununla birlikte, ayrık verilerle, tıpkı sizinki gibi veri alma konusunda sınırlı bir olasılık vardır. Yalnızca verilerin sizinkinden daha aşırı elde edilme olasılığının hesaplanması çok düşük nominal p-değerleri verir (artan tip I hatalarına yol açar), ancak verilerinizle aynı veri alma olasılığını dahil etmek, çok yüksek nominal p-değerlerine yol açar (bu da tip II hataların artmasına neden olur). Bu gerçekler ortadaki p değeri fikrini doğurur . Bu yaklaşımda, p değeri, verilerin sizinkinden daha fazla ve yarıdan daha fazla olma olasılığıdır veri olasılığı sizinkiyle aynıdır.
İşaret ettiğiniz gibi, olasılık tablosu verilerini test etmek için birçok olasılık vardır. Çeşitli yaklaşımların artı ve eksilerinin en kapsamlı tedavisi burada . Bu kağıt 2x2 tablolara özgüdür, ancak durum tablosu verileri için seçenekler hakkında daha fazla bilgi edinebilirsiniz.
Bence modelleri ciddiye almaya değer. Chi-squared gibi daha eski testler hızlı, kolay ve birçok kişi tarafından anlaşılır, ancak uygun bir model oluştururken elde ettiğiniz verilerin kapsamlı bir şekilde anlaşılmasını sağlamaz. Acil durum tablonuzdaki satırları [sütunları] bir yanıt değişkeni olarak ve sütunları [satırları] açıklayıcı / yordayıcı değişkenler olarak düşünmek mantıklıysa, bir modelleme yaklaşımı kolayca izlenir. Örneğin, sadece iki satırınız varsa, lojistik regresyon modeli oluşturabilirsiniz; birkaç sütun varsa, ANOVA tipi bir model oluşturmak için referans hücre kodlamasını (kukla kodlama) kullanabilirsiniz. Öte yandan, ikiden fazla satırınız varsa, çok terimli lojistik regresyon aynı şekilde kullanılabilir. Satırlarınızın gerçek bir düzeni varsa, sahipse sıralı lojistik regresyon multinomiyalden daha üstün performans sağlar. Benim görüşüme göre, log-lineer model (Poisson regresyonu), ikiden fazla boyutu olan beklenmedik durum tablolarınız olmadığı sürece muhtemelen daha az ilgilidir.
Bu gibi konuların kapsamlı bir tedavisi için en iyi kaynaklar Agresti'nin kitaplarıdır: ya tam ölçekli tedavisi (daha titiz), giriş kitabı (daha kolay ama yine de kapsamlı ve çok iyi) ya da muhtemelen sıra kitabı .
G2-test
G2=∑O⋅ln(OE)