Test istatistiği dağılımı bimodal ise, p değeri bir şey ifade ediyor mu?


12

P-değeri, sıfır hipotezinin doğru olduğu varsayılarak, en azından gözlemlendiği kadar aşırı bir test istatistiği elde etme olasılığı olarak tanımlanır. Diğer bir deyişle,

Peki ya test istatistiği dağılımda bimodal ise? p değeri bu bağlamda bir şey ifade ediyor mu? Örneğin, ben R bazı bimodal verileri simüle edeceğim:

P(Xt|H0)
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5)) 
hist(bimodal, breaks=100)

resim açıklamasını buraya girin

Ve diyelim ki 60'lık bir test istatistik değeri gözlemliyoruz. Ve burada resimden bu değerin çok düşük olduğunu biliyoruz . İdeal olarak, bunu ortaya koymak için kullandığım istatistik prosedürü (örneğin, p-değeri) istiyorum. Ancak, tanımlandığı gibi p değeri hesaplarsak, oldukça yüksek bir p değeri elde ederiz.

observed <- 60

# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993

Dağılımı bilmeseydim, gözlemlediğim şeyin rastgele tesadüf olduğu sonucuna varabilirdim. Ama bunun doğru olmadığını biliyoruz.

Sanırım şu sorum var: Neden p-değerini hesaplarken, değerlerin olasılığını "en azından en az" gözlemlenen kadar hesaplıyoruz? Ve yukarıda simüle ettiğim gibi bir durumla karşılaşırsam, alternatif çözüm nedir?


7
Null Hipotez Anlam Testi'nin harika dünyasına hoş geldiniz! Cidden: Dürüst olmak gerekirse , sıfır hipotezi altında (NHST'de önemsediğimiz) bimodal dağılımı olan bir test istatistiği düşünemiyorum. Yani ilginç bir soru için +1, ama aklınızda belirli bir örnek olmadıkça, pratik ilgisinden şüphe ediyorum?
Stephan Kolassa

1
@StephanKolassa; kesinlikle bimodal olan veri dağılımları vardır, ama ne tür test istatistiği nedir?
Peter Flom - Monica'yı eski durumuna döndürün

7
İlk formülün önerdiği p-değerlerinin karakterizasyonuna katılmıyorum. Neyman-Pearson teorisinde doğru "en azından aşırı" duygusu, gerçeklerin olağan düzeni açısından değil (formülde belirtildiği gibi) göreceli olabilirlik anlamındadır. İkisi birçok standart test durumunda eşdeğerdir ancak örnekleme dağılımı bimodal olduğunda keskin bir şekilde farklılık gösterir. Bu ayrım bu nedenle soruyu tatmin edici bir şekilde çözecektir.
whuber

@whuber Bu konuyu biraz basit bir örnekle açıklayabilir misiniz?
Szabolcs

2
Gθ(θ,θ)θ1Fθ(x)Gθ(x)Gθ(x)x[1,1]F1F2±1/2XFθH0:XF1 HA:XF2±11/21/2θ=2

Yanıtlar:


5

Test istatistiğini "aşırı" yapan şey, örnek alanına bir sipariş (veya en azından kısmi bir emir) uygulayan alternatifinize bağlıdır - bu durumları en tutarlı (bir test istatistiği ile ölçülen anlamda) alternatif.

Eğer gerçekten olmadığında var size, aslında sıralamasını vermek olasılığı ile kalacaksın ile en tutarlı olması için bir şey vermek dışında bir seçeneği en sık Fisher'in kesin testi görülen. Burada, null altındaki sonuçların olasılığı (2x2 tabloları) test istatistiklerini sıralar (böylece 'aşırı' 'düşük olasılık' olur).

Eğer bimodal null dağılımınızın en solunun (veya en sağının ya da her ikisinin) ilgilendiğiniz alternatifle ilişkilendirildiği bir durumda olsaydınız, 60'lık bir test istatistiğini reddetmek istemezsiniz. Ama eğer Eğer böyle bir alternatif yok bir durumdayız, daha sonra 60 olduğunu unsual - düşük olasılığını vardır; 60 değeri modelinizle tutarsızdır ve reddetmenize neden olur.

[Bu, bazıları tarafından Fisherian ve Neyman-Pearson hipotez testleri arasında merkezi bir fark olarak görülecektir. Açık bir alternatif ve bir olasılık oranı sunarak , sıfırın altındaki düşük bir olasılık, bir Neyman-Pearson çerçevesinde reddetmenize neden olmaz (alternatifle karşılaştırıldığında nispeten iyi performans gösterdiği sürece), Fisher için, gerçekten bir alternatifiniz yok ve sıfırın altında olma olasılığı ilgilendiğiniz şeydir.]

Her iki yaklaşımın da doğru ya da yanlış olduğunu önermiyorum - devam edin ve kendinize karşı ne tür alternatifler aradığınızı, belirli bir yaklaşım olsun ya da sadece sıfırın altında olması muhtemel olmayan herhangi bir şeyi kendiniz hesaplayın. Ne istediğinizi öğrendikten sonra, geri kalanı ('en azından aşırı' ne anlama geldiğini de içerir) bundan hemen hemen sonra gelir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.