Fisher'ın kesin testindeki test istatistiği nedir?


9

2 2 ile ihtimal tablosundan, bazı bahsedilen Fisher'in kesin testi sayısı kullanan Test istatistik olarak tabloda (1,1), hücre içinde, ve sıfır hipotezi altında irade hipergeometrik dağılım gösterir.X1,1X1,1

Bazıları test istatistiklerinin burada , null altındaki hipergeometrik dağılımın (yukarıda belirtilen) ortalamasıdır. Ayrıca p-değerlerinin hipergometrik dağılım tablosuna göre belirlendiği de söylenmiştir. Ortalama çıkarmak ve sonra mutlak değer almak için bir neden olup olmadığını merak ediyordum? null altında hipergeometrik dağılımı yok, değil mi?

|X1,1-μ|
μ|X1,1-μ|

Yanıtlar:


10

(Fikirlerimizi biraz daha kesin yapmak için, 'test istatistiğini' p-değerini hesaplamak için aradığımız şeyin dağılımı diyelim. Bu, iki kuyruklu bir t testi için test istatistiğimiz |T| ziyade T.)

Bir test istatistiği ne yaparsa , örnek alanı (veya daha kesin olarak kısmi bir sıralama) üzerinde bir sıralamaya neden olur, böylece uç durumları (alternatif ile en tutarlı olanları) tanımlayabilirsiniz.

Fisher'ın kesin testi durumunda, zaten bir anlamda bir sipariş var - bunlar çeşitli 2x2 tabloların kendileri. Olduğu gibi, siparişe karşılık gelirlerX1,1 en büyük veya en küçük değerlerin X1,1“aşırı” ve aynı zamanda en düşük olasılıklı olanlardır. Yani değerlerine bakmak yerineX1,1 önerdiğiniz şekilde, kişi büyük ve küçük uçlardan çalışabilir, her adımda sadece hangi değeri (en büyük veya en küçük) X1,1-değeri zaten orada değil), onunla ilişkili en küçük olasılığa sahiptir, gözlemlenen tablonuza ulaşana kadar devam eder; dahil edilmesiyle, tüm bu aşırı tabloların toplam olasılığı p-değeridir.

İşte bir örnek:

hipergeometrik olasılık fonksiyonu

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

İlk sütun X1,1 değerleri, ikinci sütun olasılıklar ve üçüncü sütun uyarılmış sıralamasıdır.

Bu nedenle, Fisher kesin testinin her bir durumunda, her tablonun olasılığı (eşdeğer olarak, her birininX1,1değeri) gerçek test istatistiği olarak kabul edilebilir .

Önerilen test istatistiklerinizi karşılaştırırsanız |X1,1-μ|, bu durumda aynı sıralamayı tetikler (ve genel olarak bunu yaptığına inanıyorum, ancak kontrol etmedim), bu istatistiğin daha büyük değerleri olasılığın daha küçük değerleri olduğundan, eşit olarak 'istatistik' olarak kabul edilebilir. - ama diğer birçok miktar da olabilir - aslında bu siparişi koruyan herhangi bir miktarX1,1her durumda s eşdeğer test istatistikidir, çünkü her zaman özdeş p değerleri üretir.

Ayrıca başlangıçta daha kesin bir 'test istatistiği' kavramı ortaya konduğunda, bu soruna ilişkin olası test istatistiklerinin hiçbirinin gerçekte hipergeometrik bir dağılımı olmadığını; X1,1ancak aslında iki kuyruklu test için uygun bir test istatistiği değildir (ikinci diyagonalde değil, ana diyagonalde sadece daha fazla ilişkinin alternatif ile tutarlı olduğu tek taraflı bir test yapsaydık, o zaman bir test istatistiği). Bu sadece başladığım tek kuyruklu / iki kuyruklu bir konudur.

[Düzenle: bazı programlar Fisher testi için bir test istatistiği sunar; Bu asitotik olarak ki-kare ile karşılaştırılabilir -2logL tipi hesaplama olacağını varsayalım. Bazıları oran-oranını veya günlüğünü de gösterebilir, ancak bu tam olarak eşdeğer değildir.]


Teşekkürler Glen_b! dağılımıX1,1 null altında, ortalama etrafında simetrik olmayan hipergeometrik dağılım μ. Bu yüzden merak ediyorum|X1,1-μ|test istatistiği nedir?
Tim

Tamamen yorumlanabilir ve kolayca anlaşılabildiği için oldukça makul bir test istatistiği gibi görünüyor. Gerçekten de olası istatistiklerin hiçbirinin simetrik bir dağılımı olmayacaktır. Fisher testinin özelliklerini bir an için unutalım - eğer bu istatistik sizin için anlamlıysa , o temelde kesin bir test hesaplayabilirsiniz (olasılıkları bulmak için hipergeometrik hesaplamaları kullanarak). Her durumda aynı düzeni tetiklediklerini göstermek istiyorsanız, bu muhtemelen yeni bir soru.
Glen_b

6

|X1,1-μ| genel olarak hipergeometrik dağılımı olamaz çünkü μ bir tamsayı değeri olması gerekmez ve sonra |X1,1-μ|bir tamsayı olmaz. Ancak şartlı olarak marjlarda,X1,1 hipergeometrik dağılım gösterir.

Düzgün yapar ve kenar boşluklarını bilinen değerlere sabitlerseniz, X1,1(veya başka herhangi bir hücre) istatistiğiniz olmalıdır. Çizim benzetmesi ilek urn içeren topları W beyaz toplar ve B yedek olmadan siyah toplar, X1,1 çizilen beyaz top sayısı olarak yorumlanabilir. B ilk sıranın toplamıdır, W ikinci sıranın toplamıdır, k ilk sütunun toplamıdır.


4

Gerçekten bir tane yok. Test istatistikleri tarihsel bir anomalidir - test istatistiklerine sahip olmamızın tek nedeni p değerine ulaşmaktır. Fisher kesin testi bir test istatistiği geçerek doğrudan bir p-değerine gider.


Teşekkürler, ama gerçekten bir test istatistiği yok mu? P değerini nasıl belirlersiniz?
Tim

Fisher'ın kesin testinin sonucu p değeridir.
Jeremy Miles

@JeremyMiles: Test istatistiklerinin, düşük maliyetli hesaplamadan önce, kullanıcıların Z, t vb. Hesapladıkları ve daha sonra istatistiksel anlamlılığı belirlemek için bu test istatistiklerini önceden hesaplanmış tablolarla karşılaştırdığı tarihsel anormallikler anlamına mı geliyor, Çıkarımsal istatistiklerin mevcut birçok kullanıcısı, p değeri ne kadar kolay bir şekilde sağlayabildiğini hala test istatistikleri açısından düşünüyor? Başka bir deyişle, bu bir tür kuşaksal etki mi?
rabidotter

1
@ rabidotter - evet, sanırım yaparım. "F = 14.352, df = 2, 568, p <0.05" yazan insanlar görüyorsunuz. Hemen hemen herkesin F'yi önemsemesinin tek nedeni P'yi hesaplamaktır, ancak F'yi büyük hassasiyete ve p'yi çok az hassasiyete verir.
Jeremy Miles
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.