özet
Aşan veri sayısı 3.5 olasılığı bilinmeyen bir Binom dağılımı var p. Binom testi içinp=1/2 alternatife karşı p≠1/2.
Bu yazının geri kalanı altta yatan modeli açıklar ve hesaplamaların nasıl yapılacağını gösterir. R
Bunları gerçekleştirmek için çalışma kodu sağlar . Altta yatan hipotez testi teorisinin Uzatılmış hesap sağlanır cevabım "istatistiksel testlerde p-değerleri ve t-değerlerinin anlamı nedir?" .
İstatistiksel model
Değerlerin makul derecede farklı olduğu varsayılarak ( 3.5), sonra sıfır hipoteziniz altında, rastgele örneklenmiş herhangi bir değerin 1/2=50% aşma şansı 3.5 (dan beri 3.5popülasyonun orta değeri olarak karakterize edilir). Tümü varsayarsak250 değerler rastgele ve bağımsız olarak örneklendi, bunların sayısı aşıldı 3.5 bu nedenle bir Binom'a sahip olacak( 250 , 1 / 2 )dağılımı. Bu numaraya "sayım" diyelim.k.
Öte yandan, eğer nüfus medyanı 3.5, rastgele örneklenmiş bir değerin 3.5 farklı olacak 1 / 2. Alternatif hipotez budur.
Uygun bir test bulma
Sıfır durumu alternatiflerinden ayırmanın en iyi yolu, kbüyük olasılıkla sıfırın altında olan ve alternatifler altında daha az olası olan Bunlar yakınındaki değerler1 / 2 nın-nin 250, eşittir 125. Bu nedenle, testiniz için kritik bir bölge nispeten uzaktaki değerlerden oluşur.125: yakın 0 veya yakın 250. Ama ne kadar uzak125 önemli kanıtlar oluşturmalılar mı? 3.5 nüfus medyan değil mi?
Önem standardınıza bağlıdır: buna test boyutu denir , genellikleα. Sıfır hipotezi altında, birα şans k kritik bölgede olacak.
Normalde, hangi alternatifin uygulanacağı konusunda önyargılarımız olmadığında - bir medyan daha büyük veya daha az 3.5- kritik bölgeyi bu şansın yarısı olacak şekilde inşa etmeye çalışıyoruz, α / 2, bu k düşük ve diğer yarısı, α / 2, bu kyüksektir. Çünkü dağıtımını biliyoruzk sıfır hipotezi altında, bu bilgi kritik bölgeyi belirlemek için yeterlidir.
Teknik olarak, hesaplamayı yapmanın iki yaygın yolu vardır: Binom olasılıklarını hesaplayın veya Normal bir dağılımla yaklaşık olarak hesaplayın.
Binom olasılıkları ile hesaplama
Yüzde nokta (kantil) işlevini kullanın. In R
Örneğin, bu denir qbinom
ve benzeri çağrılan olacak
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
İçin çıktı α = 0.05 dır-dir
109 141
Bu, kritik bölgenin tüm düşük değerleri içerdiği anlamına gelir. k arasında (ve dahil) 0 ve 109, tüm yüksek değerleriyle birlikte k arasında (ve dahil) 141 ve 250. Bir kontrol olarak, null doğru olduğunda o bölgede yatma R
şansını hesaplamayı isteyebiliriz k
:
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
Çıktı 0,0497, çok yakın - ama daha büyük değil-αkendisi. Kritik bölge bir tam sayı ile bitmesi gerektiğinden, bu gerçek test boyutunu tam olarak nominal test boyutuna eşit yapmak genellikle mümkün değildirαancak bu durumda iki değer gerçekten çok yakındır.
Normal yaklaşımla hesaplama
Bir Binomun ortalaması( 250 , 1 / 2 ) dağıtım 250 x 1 / 2 = 125 ve varyansı 250 x 1 / 2 x ( 1 - 1 / 2 ) = 250 / 4, standart sapmasını eşit 250 / 4-----√.9 7.9. Binom dağılımını Normal dağılımla değiştireceğiz. Standart Normal dağılımα / 2 = 0.05 / 2 olasılıktan daha az - 1.95996, R
komut tarafından hesaplandığı gibi
qnorm(alpha/2)
Normal dağılımlar simetrik olduğu için 0.05 / 2 olasılıktan daha büyük + 1.95996. Bu nedenle kritik bölge,k daha fazlası 1,95996 standart sapmalar 125. Bu eşikleri hesaplayın: eşitler125±7.9×1.96≈109.5,140.5. Hesaplama,
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
Dan beri k tam sayı olması gerektiğinde kritik bölgeye düşeceğini görüyoruz. 109 veya daha az veya 141veya daha büyük. Bu cevap, tam Binom hesaplaması kullanılarak elde edilen cevapla aynıdır. Bu durum genelliklep daha yakın 1/2 olduğundan daha 0 veya 1, örnek boyutu orta ila büyük (onlarca veya daha fazla) ve α çok küçük değil (yüzde birkaç).
Bu test, popülasyonla ilgili hiçbir şey varsaymadığı için (medyanına odaklanmış çok fazla olasılık bulunmaması dışında), popülasyon hakkında spesifik varsayımlar yapan diğer testler kadar güçlü değildir. Test yine de null değerini reddederse, güç eksikliğinden endişelenmenize gerek yoktur. Aksi takdirde, üstlenmeye istekli olduğunuz ve nüfus hakkında sonuçlandırabileceğiniz şeyler arasında bazı hassas ödünleşmeler yapmalısınız .