(Fikirlerimizi biraz daha kesin yapmak için, 'test istatistiğini' p-değerini hesaplamak için aradığımız şeyin dağılımı diyelim. Bu, iki kuyruklu bir t testi için test istatistiğimiz | T| ziyade T.)
Bir test istatistiği ne yaparsa , örnek alanı (veya daha kesin olarak kısmi bir sıralama) üzerinde bir sıralamaya neden olur, böylece uç durumları (alternatif ile en tutarlı olanları) tanımlayabilirsiniz.
Fisher'ın kesin testi durumunda, zaten bir anlamda bir sipariş var - bunlar çeşitli 2x2 tabloların kendileri. Olduğu gibi, siparişe karşılık gelirlerX1 , 1 en büyük veya en küçük değerlerin X1 , 1“aşırı” ve aynı zamanda en düşük olasılıklı olanlardır. Yani değerlerine bakmak yerineX1 , 1 önerdiğiniz şekilde, kişi büyük ve küçük uçlardan çalışabilir, her adımda sadece hangi değeri (en büyük veya en küçük) X1 , 1-değeri zaten orada değil), onunla ilişkili en küçük olasılığa sahiptir, gözlemlenen tablonuza ulaşana kadar devam eder; dahil edilmesiyle, tüm bu aşırı tabloların toplam olasılığı p-değeridir.
İşte bir örnek:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
İlk sütun X1 , 1 değerleri, ikinci sütun olasılıklar ve üçüncü sütun uyarılmış sıralamasıdır.
Bu nedenle, Fisher kesin testinin her bir durumunda, her tablonun olasılığı (eşdeğer olarak, her birininX1 , 1değeri) gerçek test istatistiği olarak kabul edilebilir .
Önerilen test istatistiklerinizi karşılaştırırsanız |X1 , 1- μ |, bu durumda aynı sıralamayı tetikler (ve genel olarak bunu yaptığına inanıyorum, ancak kontrol etmedim), bu istatistiğin daha büyük değerleri olasılığın daha küçük değerleri olduğundan, eşit olarak 'istatistik' olarak kabul edilebilir. - ama diğer birçok miktar da olabilir - aslında bu siparişi koruyan herhangi bir miktarX1 , 1her durumda s eşdeğer test istatistikidir, çünkü her zaman özdeş p değerleri üretir.
Ayrıca başlangıçta daha kesin bir 'test istatistiği' kavramı ortaya konduğunda, bu soruna ilişkin olası test istatistiklerinin hiçbirinin gerçekte hipergeometrik bir dağılımı olmadığını; X1 , 1ancak aslında iki kuyruklu test için uygun bir test istatistiği değildir (ikinci diyagonalde değil, ana diyagonalde sadece daha fazla ilişkinin alternatif ile tutarlı olduğu tek taraflı bir test yapsaydık, o zaman bir test istatistiği). Bu sadece başladığım tek kuyruklu / iki kuyruklu bir konudur.
[Düzenle: bazı programlar Fisher testi için bir test istatistiği sunar; Bu asitotik olarak ki-kare ile karşılaştırılabilir -2logL tipi hesaplama olacağını varsayalım. Bazıları oran-oranını veya günlüğünü de gösterebilir, ancak bu tam olarak eşdeğer değildir.]