Bir popülasyonun medyanı nasıl test edilir?


9

250 birimden bir örnek aldım. Dağılım asimetriktir. Nüfusun medyanının 3.5'ten farklı olduğuna dair bir hipotezi test etmek istiyorum, bu yüzden tek örneklem testinin uygun olacağını düşünüyorum. Wilcoxon rank testinin uygun olmadığını biliyorum çünkü dağılım simetrik değil. İşaret testi kullanılmaya uygun mu? Değilse, başka bir test önerebilir mi?


3
Birkaç nedenden ötürü beni ilk hatta kaybettin. (1) Bir örnek bir Gauss dağılımına sahip olamaz (ancak yaklaşık olarak bir tane olabilir). (2) Tüm Gauss dağılımlarının (ve dolayısıyla bunlara yaklaşmanın) bir özelliği simetridir . Kendinizle çeliştiniz. Verilerinizi istatistiksel jargon yerine kendi terimlerinizle tanımlayarak, sahip olduklarınızla daha iyi iletişim kuracaksınız. Verilerinizle gerçekten neyi başarmak istediğinizi olabildiğince açık bir şekilde açıklayabilir misiniz? "Medyan bazlı örnek testi" ne tür bilgiler vermek içindir?
whuber

1
Numunenin medyanı ne olursa olsun; bunu test etmeye gerek kalmayacaktı. Belki de popülasyonun medyanının (numunenin alındığı) eşit olup olmadığını test etmek istersiniz ? Eğer öyleyse, değerinin nasıl geliştirildiğini bilmek önemlidir . Belki başka bir veri kümesinin özeti midir? Yoksa kalite standardı gibi önceden belirlenmiş bir sayı mı? 3.53.5
whuber

1
Önceden belirlenmiş bir sayıdır
LeonRupnik

2
" Dağıtım asimetrik, bu yüzden bir popülasyonun medyanı 3.5'ten farklıysa bir hipotezi test etmek istiyorum ..." - Bir örnekte asimetri neden hipotezin ilginç olduğunu etkiliyor?" Bir işaret testi kullanmak için uygun mu? " - emin, ancak (en azından orijinal formda) sürekliliğe dayanıyor - değişkeniniz ayrıksa (verilerinizin nelerden oluştuğunu söylemezseniz) uyarlamanız gerekir .
Glen_b

Veriler sürekli
LeonRupnik

Yanıtlar:


8

özet

Aşan veri sayısı 3.5 olasılığı bilinmeyen bir Binom dağılımı var p. Binom testi içinp=1/2 alternatife karşı p1/2.

Bu yazının geri kalanı altta yatan modeli açıklar ve hesaplamaların nasıl yapılacağını gösterir. RBunları gerçekleştirmek için çalışma kodu sağlar . Altta yatan hipotez testi teorisinin Uzatılmış hesap sağlanır cevabım "istatistiksel testlerde p-değerleri ve t-değerlerinin anlamı nedir?" .

İstatistiksel model

Değerlerin makul derecede farklı olduğu varsayılarak ( 3.5), sonra sıfır hipoteziniz altında, rastgele örneklenmiş herhangi bir değerin 1/2=50% aşma şansı 3.5 (dan beri 3.5popülasyonun orta değeri olarak karakterize edilir). Tümü varsayarsak250 değerler rastgele ve bağımsız olarak örneklendi, bunların sayısı aşıldı 3.5 bu nedenle bir Binom'a sahip olacak(250,1/2)dağılımı. Bu numaraya "sayım" diyelim.k.

Öte yandan, eğer nüfus medyanı 3.5, rastgele örneklenmiş bir değerin 3.5 farklı olacak 1/2. Alternatif hipotez budur.

Uygun bir test bulma

Sıfır durumu alternatiflerinden ayırmanın en iyi yolu, kbüyük olasılıkla sıfırın altında olan ve alternatifler altında daha az olası olan Bunlar yakınındaki değerler1/2 nın-nin 250, eşittir 125. Bu nedenle, testiniz için kritik bir bölge nispeten uzaktaki değerlerden oluşur.125: yakın 0 veya yakın 250. Ama ne kadar uzak125 önemli kanıtlar oluşturmalılar mı? 3.5 nüfus medyan değil mi?

Önem standardınıza bağlıdır: buna test boyutu denir , genellikleα. Sıfır hipotezi altında, birα şans k kritik bölgede olacak.

Normalde, hangi alternatifin uygulanacağı konusunda önyargılarımız olmadığında - bir medyan daha büyük veya daha az 3.5- kritik bölgeyi bu şansın yarısı olacak şekilde inşa etmeye çalışıyoruz, α/2, bu k düşük ve diğer yarısı, α/2, bu kyüksektir. Çünkü dağıtımını biliyoruzk sıfır hipotezi altında, bu bilgi kritik bölgeyi belirlemek için yeterlidir.

Teknik olarak, hesaplamayı yapmanın iki yaygın yolu vardır: Binom olasılıklarını hesaplayın veya Normal bir dağılımla yaklaşık olarak hesaplayın.

Binom olasılıkları ile hesaplama

Yüzde nokta (kantil) işlevini kullanın. In RÖrneğin, bu denir qbinomve benzeri çağrılan olacak

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

İçin çıktı α=0.05 dır-dir

109 141

Bu, kritik bölgenin tüm düşük değerleri içerdiği anlamına gelir. k arasında (ve dahil) 0 ve 109, tüm yüksek değerleriyle birlikte k arasında (ve dahil) 141 ve 250. Bir kontrol olarak, null doğru olduğunda o bölgede yatma Rşansını hesaplamayı isteyebiliriz k:

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

Çıktı 0,0497, çok yakın - ama daha büyük değil-αkendisi. Kritik bölge bir tam sayı ile bitmesi gerektiğinden, bu gerçek test boyutunu tam olarak nominal test boyutuna eşit yapmak genellikle mümkün değildirαancak bu durumda iki değer gerçekten çok yakındır.

Normal yaklaşımla hesaplama

Bir Binomun ortalaması(250,1/2) dağıtım 250x1/2=125 ve varyansı 250x1/2x(1-1/2)=250/4, standart sapmasını eşit 250/47.9. Binom dağılımını Normal dağılımla değiştireceğiz. Standart Normal dağılımα/2=0.05/2 olasılıktan daha az -1,95996, Rkomut tarafından hesaplandığı gibi

qnorm(alpha/2)

Normal dağılımlar simetrik olduğu için 0.05/2 olasılıktan daha büyük +1,95996. Bu nedenle kritik bölge,k daha fazlası 1,95996 standart sapmalar 125. Bu eşikleri hesaplayın: eşitler125±7.9×1.96109.5,140.5. Hesaplama,

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

Dan beri k tam sayı olması gerektiğinde kritik bölgeye düşeceğini görüyoruz. 109 veya daha az veya 141veya daha büyük. Bu cevap, tam Binom hesaplaması kullanılarak elde edilen cevapla aynıdır. Bu durum genelliklep daha yakın 1/2 olduğundan daha 0 veya 1, örnek boyutu orta ila büyük (onlarca veya daha fazla) ve α çok küçük değil (yüzde birkaç).


Bu test, popülasyonla ilgili hiçbir şey varsaymadığı için (medyanına odaklanmış çok fazla olasılık bulunmaması dışında), popülasyon hakkında spesifik varsayımlar yapan diğer testler kadar güçlü değildir. Test yine de null değerini reddederse, güç eksikliğinden endişelenmenize gerek yoktur. Aksi takdirde, üstlenmeye istekli olduğunuz ve nüfus hakkında sonuçlandırabileceğiniz şeyler arasında bazı hassas ödünleşmeler yapmalısınız .


2
Bu, pratik olarak , yalnızca aynı felsefeyi benimsemekle değil, aynı zamanda cevabınızın yapılandırıldığı şekilde, daha soyut " p-değeri anlamı " cevabınızın da çalışılmış bir örneği olduğundan, bence bunu birbirine bağlamanız gerekir (" bunun pratikte nasıl uygulandığına cevabımı ... ") bulabilirsiniz.
Silverfish

2
@Silver Teşekkür ederim; bu gerçekten aklımdan geçti. Önce biraz bekleyebileceğimi düşündüm. Diğer şeylerin yanı sıra, bazı girişimci topluluk üyeleri daha yakından incelemek istediğim yinelenen bir konu açacaklarsa şaşırmam. Sonuçta, bu temel malzeme - binom testleri hakkında birçok soru sordu. Bunun yeni olması gereken tek iddia, buraya bir medyan testi ihtiyacı olarak geldiğidir - bu yüzden başlangıçta o kadar açık bir binom testi değildi - ve tek cevabımın layık olması gerektiği iddiası okuma, her adımı açıklama çabasında yatar.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.