Dağılımların eşitliği için ki-kare testi: kaç sıfıra tolere eder?


10

Her biri 21 farklı fenotipten sadece birine sahip olabilen iki mutant grubunu karşılaştırıyorum. Bu sonuçların dağılımının iki grup arasında benzer olup olmadığını görmek istiyorum. "Dağılımların eşitliği için ki-kare testi" ni hesaplayan ve bana bazı makul sonuçlar veren çevrimiçi bir test buldum . Ancak, bu tabloda birkaç sıfırım var, bu durumda ki-kare kullanabilir miyim?

İşte iki gruplu tablo ve belirli fenotiplerin sayısı:

2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1

Masa doğru çıkmadı. Her tek sayı, grup 1'den bir sayıdır ve her çift sayı, grup 2'den ilgili sayıdır
Membran

Sorunuzu yeniden biçimlendirdim. Tablo şimdi doğru mu?
csgillespie

Yanıtlar:


8

Bu günlerde Fisher'in böyle bir masada 'kesin' testi yapmak için mükemmel bir şekilde uygulanabilir . Stata'yı kullanarak p = 0.087 aldım tabi 2 1 \ 2 3 \ .... , exact. ( Yürütme 0.19 saniye sürdü).

Aşağıdaki chl'nin yorumundan sonra DÜZENLE (yorum olarak eklemeyi denedim ancak biçimlendiremiyorum):

Benim için R 2.12.0 çalışır, ancak ben 'çalışma alanı' seçeneğini 200000 varsayılan değeri üzerinde artırmak zorunda kaldı:

> fisher.test(x)
Error in fisher.test(x) : FEXACT error 7.
LDSTP is too small for this problem.
Try increasing the size of the workspace.
> system.time(result<-fisher.test(x, workspace = 400000))
   user  system elapsed 
   0.11    0.00    0.11 
> result$p.value
[1] 0.0866764

(Yürütme süresi Stata'dan biraz daha hızlıdır, ancak fisher.test olmasına rağmen R'nin olağan anlamından farklı bir şey ifade etmek için 'çalışma alanını' kullanan hata mesajının anlamını çözmek için harcanan zaman göz önüne alındığında şüpheli bir alaka düzeyidir. R'nin temel 'istatistik' paketinin bir parçasıdır.)


1
İlginç, Fisher'ın testi R.
chl'de

Daha fazla oy veremiyorum, üzgünüm. Wksp'yi yeterince arttırmamışım gibi görünüyor :)
chl

Fisher'ın "kesin" testi aslında biraz farklı bir soruyu ele almıyor mu: "... iki tür sınıflandırma arasındaki ilişkinin önemini (olasılık) incelemek için kullanılır" (wiki sayfası). Benim durumumda, fenotiplerin 2 grup arasındaki dağılımının benzer (eşit) olduğu hipotezini doğrulamaya (ya da reddetmeye) çalıştım. "Dağılımların eşitliği için ki-kare testi" isimli çevrimiçi testi (ilk gönderiye bakın) bulduğumda, bunun benim sorunum için olduğunu düşündüm ...
Membran

Ayrıca, Fisher testinin bahsedilen versiyonunun iki dağılımı karşılaştırmak için iyi olduğunu düşünüyorsanız, aynı zamanda dağılımın eşitliğini kontrol etmek için de kullanılabilir mi (yani bir grup içindeki fenotiplerin sınırlı sayıda olası fenotip arasında eşit olmayan bir şekilde dağıtıldığını söylemek için) ? Bunu CHITEST işlevini kullanarak Excel'de bile yapabilirsiniz, ancak yukarıdaki değerlere benzer bir dağılımım varsa, 5'den az kez çok sayıda fenotip gözlenirse ne olur?
Membran

@Membran # 1: Fisher'in her iki marjinal toplam setindeki kesin test koşulları olarak biraz farklı bir sorudur. Bu benim için akademik istatistiksel bir şey gibi görünüyor ve ben akademisyen bir istatistikçiyim. (BTW hangi wiki'ye başvurduğunuzu açıklığa kavuşturabilir misiniz?) @Membran # 2: Tek yönlü bir tablo olması durumunda koşullu tam testi "Fisher'in kesin testi" olarak adlandırmam, ancak böyle bir test mümkün olmalıdır. Ve ben tek yönlü tablolar için daha basit düşünürdüm, ancak şu anda yardımcı olacak yazılım bulamıyorum ve hesaplama yapmadan zamanım yok.
onestop

5

Genel yönergeler, beklenen sayıların 5'ten büyük olması gerektiğidir, ancak aşağıdaki makalede tartışıldığı gibi biraz rahatlayabilir:

Campbell, I, Chi-squared ve Fisher-Irwin, küçük örnek önerileri ile ikişer tablonun testleri, Tıpta İstatistikler (2007) 26 (19): 3661-3675.

Ayrıca bkz. Ian Campbell'ın ana sayfası .

pchisq.test(..., sim=TRUE)

Sizin durumunuzda, beklenen sayıların yaklaşık% 80'inin 5'in altında ve% 40'ının 1'in altında olduğu görülmektedir. Gözlenen fenotiplerin bir kısmını toplamak mantıklı olur mu?


Önerileriniz için teşekkür ederiz. Mantıksal olarak, her biri kaydedilen üç parametrenin benzersiz bir kombinasyonu olduğu için fenotipleri birleştirmek pek mümkün değildir. Bu parametrelerin her biri bir mutasyon sonucu "yukarı", "aşağı" veya "değişmeden" kalabileceğinden, 3 ^ 3 = 27 farklı fenotip olabilir. Yukarıdaki örnekte, her iki grubun "0" puan aldığı fenotipleri kaldırdım, bu yüzden sadece 21 tanesi vardı. Bazı fenotiplerin yaygınlığını görüyorum, ancak bu tür fenotiplerin mutantların çeşitli gruplarındaki dağılımlarının benzer (veya değil) olduğuna dair bazı istatistiksel kanıtlara sahip olmak istiyorum. Teşekkür ederim!
Membran

1
@Membran Aggregation anlamlı olmak zorunda değildir: çöp kutularını istediğiniz gibi birleştirebilirsiniz. Bununla birlikte, ince bir sorun, fiili sonrası toplamanın p-değerlerini şüpheye atmasıdır; toplama verilerden bağımsız olmalıdır.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.