Bağımsızlık testi ve homojenlik testi


10

Temel bir istatistik dersi veriyorum ve bugün iki kategori için ki-kare bağımsızlık testini ve homojenlik testini ele alacağım. Bu iki senaryo kavramsal olarak farklıdır, ancak aynı test istatistiği ve dağılımını kullanabilir. Bir homojenlik testinde, kategorilerden biri için marjinal toplamların tasarımın bir parçası olduğu varsayılır - her deney grubu için seçilen konu sayısını temsil ederler. Ancak ki-kare testi tüm marjinal toplamlarda koşullandırma etrafında döndüğü için, homojenlik testleri ile bağımsızlık testleri arasında kategorik verilerle ayrım yapmanın matematiksel sonuçları yoktur - en azından bu test kullanıldığında.

Sorum şu: bağımsızlık için test edip etmediğimize (tüm marjinallerin rasgele değişkenler olduğu) veya homojenlik testinin (bir dizi marjinal olduğu) tasarım tarafından belirlenen)?

Sürekli durumda, nerede gözlemlediğimizi söyleyin (X,Y) aynı konu üzerinde ve bağımsızlık testi yapın veya gözlemleyin (X1,X2)farklı popülasyonlarda ve aynı dağılımdan gelip gelmediklerini test etmede yöntem farklıdır (korelasyon analizi ve t-testi). Kategorik veriler ayrık sürekli değişkenlerden geliyorsa ne olur? Bağımsızlık ve homojenlik testleri ayırt edilemez mi?


2
"Homojenlik testi" ve "bağımsızlık testi" ni ayıran bir kaynak sağlayabilir misiniz? Eskiden aynı olduğunu düşünürdüm (ve Wikipedia da). Ayrıca, 2 yönlü bitişik tablo için ki-kare birliktelik testi veya K-bağımsız numuneler ki-kare karşılaştırma testi olarak da adlandırılır. Ki-kare anlaşma testi olarak da bilinen tek örnek ki-kare testi ile karıştırılmamalıdır . İçinde, gözlemlediğimiz frekansları sağladığımız teorik beklenen frekanslara karşı test ediyoruz.
ttnphns

2
@ttnphns Endemik gibi görünüyor. Raluca Balan ve Gilles Lamothe'nin "Beklenmeyeni Bekle" yi kullanıyorum. Geçen yıl İşletme İstatistiklerinden Sharpe, De Veaux, et al. Her iki metin de bu ayrımın bir öğünüdür. Her iki durumda da, 2 yönlü bir acil durum tablosumuz var. Söylemeye gerek yok, her iki kitap da beklenmedik durum tablosu için bir etki büyüklüğü öğretmeye değer olduğunu düşünmüyor: temel istatistik derslerinde inceliklerin zafere ulaştığı başka bir durum.
Placidia

2
Efekt boyutu için bir güven aralığı almaya çalıştığınızda fark görünmelidir.
Ray Koopman

2
Kulağa ilginç geliyor. Bazı özellikler eklemeyi ve bir cevap vermeyi düşünür müsünüz?
Placidia

4
Bu, koşullu / koşulsuz marjlar ayrımıyla öğrencilere işkence yapmak isteyip istemediğinize bağlıdır. Değilse, sadece "iki kategorik değişkenin bağımsızlığının" "koşullu dağılımların homojenliğine" eşdeğer olduğunu ve daha sonraχ2-Ölçek. (Genellikle gerçek Cramer'lar için daha düşük güven sınırları ile birlikte sunarımVderneğin gücünü ölçer.)
Michael M

Yanıtlar:


4

Kendinize "Boş hipotezi nasıl yazarım?" Diye sormanız yeterlidir. Bir düşünün2×k bazı davranışlar arasındaki frekansların beklenmedik durum tablosu (y / n) kgrupları. 1. gruba referans olarak davranırsanız,k1 oran oranları (θi,i=1,2,,k1), frekans ve grup arasındaki ilişkiyi tanımlar.

Homojenlikte olduğu gibi bağımsızlık altında da, tüm oran oranlarının 1 olduğunu varsayarsınız. Yani, grup tayinine bakılmaksızın koşula "evet" yanıtı verme olasılığı eşittir. Bu varsayımlar başarısız olursa, en az bir grup farklıdır.

H0(homogeneity):i=1k1|θi|=0

H0(independence):i=1k1|θi|=0

Ve bu test, gözlemlenen / beklenen frekanslar kullanılarak Pearson Ki-kare testi ile gerçekleştirilebilir, bu da lojistik regresyon modeli için ayar testi k-1grup üyeliği için gösterge değişkenleri. Dolayısıyla yapısal olarak bu testlerin aynı olduğunu söyleyebiliriz.

Ancak, gruplama faktörünün doğasını düşündüğümüzde farklılıklar ortaya çıkar. Bu anlamda, testin içeriksel uygulaması veya daha doğrusu adı önemlidir. Bir grup, bir genin varlığı veya yokluğu veya bir özelliğin alel paternleri gibi bir sonuca doğrudan neden olabilir; bu durumda null değerini reddettiğimizde, sonucun söz konusu gruplama faktörüne bağlı olduğu sonucuna varırız .

Öte yandan, homojenliği test ettiğimizde, herhangi bir nedensel varsayım yapmak için kendimizi temize çıkarıyoruz. Dolayısıyla, "grup" ırk gibi karmaşık bir yapı olduğunda (genetik, davranışsal ve sosyoekonomik belirleyicilere neden olan ve bu sebeple ortaya çıkan) mahalle yoksunluk endeksinde heterojenlik ile kanıtlandığı gibi konut eşitsizliklerini deneyimleyebiliriz. . Birisi "azınlıklar, alt öğrenime kavuşmak alt gelir elde ve daha az istihdam kazanmak çünkü iyi ki en" söyleyebilirsiniz diyerek böyle bir argüman karşılık ise, "Ben onların ırk olduğunu iddia etmedi neden sen eğer sadece basit olduğunu, bunları bakmak bir yarışta, yaşam koşulları hakkında tahminlerde bulunabilirsiniz. "

Bu şekilde, bağımlılık testleri, gizleme faktörlerinin olası etkisinin ilgi çekici olduğu ve tabakalı bir analizde ele alınması gereken özel bir homojenlik testi örneğidir. Analog lojistik regresyon modelinde çok değişkenli ayarlama kullanmak böyle bir şey sağlar ve yine de bir bağımlılık testi yaptığımızı söyleyebiliriz, ancak mutlaka homojenlik değil.


3

Bayes tarzında modellerseniz, iki problem arasında açık bir fark vardır. Bazı makalelerde birinci vakaya (homojenlik) "bir kenar boşluğu sabitlenmiş" örnekleme ve ikinci duruma (bağımsızlık) "toplam tablo sabitlenmiş" denir. Örneğin, Casella ve ark. (JASA 2009) .
Bu konu üzerinde çalışıyorum ama bu ayrımı da tanımlayan makalem henüz çıkmadı :)


2
Sıkça görülen bir bakış açısından da açık bir fark var - sadece asimptotik olarak önemli değil ve her durumda bir veya her iki kenarda koşullandırma için argümanlar yapıldı.
Scortchi - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.