Sıfır hipotezinden ziyade örnekleme yoluyla üretilen güven aralıklı sıfır hipotezini reddedebilir miyiz?


9

Bir popülasyondan örneklemeden sonra bir güven aralığı biçiminde bir parametre tahmini yapabileceğimiz öğretildi. Örneğin, hiçbir varsayım ihlal edilmeden% 95 güven aralığı, tahmin ettiğimiz gerçek parametrenin popülasyonda ne olduğunu içeren bir% 95 başarı oranına sahip olmalıdır.

yani,

  1. Bir örnekten nokta tahmini üretin.
  2. Tahmin etmeye çalıştığımız gerçek değeri teorik olarak% 95 şansı olan bir dizi değer üretin.

Ancak, konu hipotez testine döndüğünde, adımlar aşağıdaki gibi tanımlanmıştır:

  1. Null hipotezi olarak bir parametre varsayalım.
  2. Bu sıfır hipotezinin doğru olduğu göz önüne alındığında çeşitli nokta tahminleri alma olasılığının bir olasılık dağılımını üretin.
  3. Eğer alacağımız nokta tahmini, sıfır hipotezi doğruysa% 5'ten daha az üretilecekse, sıfır hipotezini reddet.

Sorum şu:

Sıfırı reddetmek için sıfır hipotezini kullanarak güven aralıklarımızı üretmek gerekli midir? Neden sadece ilk prosedürü yapmıyoruz ve gerçek parametre için tahminimizi almıyoruz (güven aralığını hesaplarken varsayımsal değerimizi açıkça kullanmıyoruz) ve sonra bu aralığa düşmezse sıfır hipotezini reddediyorsunuz?

Bu sezgisel olarak bana mantıklı bir şekilde benziyor, ama korkuyorum ki çok temel bir şeyi kaçırdığımdan korkuyorum çünkü muhtemelen bu şekilde öğretilmesinin bir nedeni var.


Belirsiz olduğum için özür dilerim, Martijn. Yakında aynı soruları arayan insanlar için daha açık olması için yazımı kısa bir süre içinde düzenleyeceğim. Demek istediğim, bir örnekten bir parametre tahmini hesaplayabiliriz veya sıfır hipotezini kullanarak sıfır hipotezini desteklediğini düşündüğümüz bir dizi tahmin hesaplayabiliriz . Nokta tahminimizin bu aralıkta olup olmadığını görmek için null kullanmanın neden gerekli olduğunu anlamadım, sadece parametre tahminimizi kullanmak ve null'un parametre tahmininin sınırları içinde olup olmadığını kontrol etmek yerine. Umarım bu mantıklıdır!
Nikli

İlginç bir düşünce denemesi, birinin size ağırlıklı zarları satmaya çalışmasıdır. Onları yuvarlarlar, daha sonra gözlemlediğiniz yönde ağırlıklandıklarını belirtirler (örneğin 6, zamanın% 20'sini oluşturur). Ağırlıklı mı (yeterli örnek atışları yapıldı mı), ne kadar ve kendi (ekstra) zar atma testlerinizi yapmaya değer? Satıcı ve alıcının farklı hedefleri var ...
Philip Oakley

Yanıtlar:


5

Basit bir problem, örneğin, bilinen varyansa sahip normal bir popülasyonun ortalamasını test ederek verilir. σ2=1. Daha sonra, bir pivot - dağılımı parametreye bağlı olmayan bir miktar, tarafından verilir.Y¯μN(0,1/n). Kritik değerlerzα/2 bu simetrik durumda, Φ(-zα/2)=α/2 ve Φ(zα/2)=1-α/2.

Bu nedenle,

1-α=Pr{(X¯-μ)/(1/n)(-zα/2,zα/2)}=Pr{-zα/2(X¯-μ)nzα/2}=Pr{zα/2(μ-X¯)n-zα/2}=Pr{-zα/2/nμ-X¯zα/2/n}=Pr{X¯-zα/2/nμX¯+zα/2/n}=Pr{(X¯-zα/2/n,X¯+zα/2/n)μ}
Böylece
(X¯-zα/2/n,X¯+zα/2/n)
seviye güven aralığıdır 1-α.

Aynı zamanda, ekranın ilk satırındaki olay tam olarak sıfır hipotezinin bunun için reddedilmemesi olayıdır. μ. Geri kalanı sadece eşdeğer reformülasyonlar içerdiğinden, CI gerçekten hepsini içerirμ bunun için null değeri reddedilmez ve "null altında" ifadesine gerek yoktur.

Burada, güven aralıkları ve testler arasında dualite olarak bilinen şeyi göstermeyi amaçlayan Martijn'in +1 görselleştirmesine benzer bir grafik. C bazılarına ait güven aralığını belirtir x¯* ve bir(μ0) bazı hipotezlere ait kabul bölgesi μ=μ0.

resim açıklamasını buraya girin


10

Evet, bir hipotez testini (numuneyi test sonuçlarının varsayımsal bir dağılımıyla karşılaştırarak) numuneden hesaplanan bir güven aralığıyla karşılaştırarak değiştirebilirsiniz. Ancak dolaylı olarak bir güven aralığı zaten bir çeşit hipotez testidir:

  • Güven aralıklarının bir değer aralığı olarak oluşturulduğunu görebilirsiniz. αseviye hipotez testi başarılı olur ve aralığın dışında birα düzey hipotez testi başarısız olur.

Böyle bir aralığın yapılmasının sonucu, aralığın sadece bir kesirde başarısız olması α zaman.

Misal

Aşağıdaki sorunun cevabından bir görüntü kullanıyorum: Güven Aralıkları: resmen nasıl ele alınacağınıP(L(X)θ,U(X)θ)=1-α

Clopper-Pearson'dan bir grafiğin bir varyasyonudur . Başarı olasılığının olduğu 100 Bernoulli davası örneğini düşününθ ve toplam başarı sayısını gözlemliyoruz X.

mutlak olasılık

Bunu not et:

  • Dikey yönde hipotez testini görürsünüz. Örneğin, belirli bir varsayılmış değer içinθ ölçülürse hipotezi reddedersiniz X kırmızı veya yeşil noktalı çizgilerin üstünde veya altında.

  • Yatay yönde Clopper-Pearson güven aralıklarını görüyorsunuz. Herhangi bir gözlem X için bu güven aralıklarını kullanırsanız, zamanın sadece% 5'inde yanılıyorsunuz

    (çünkü sadece zamanın% 5'inde 'yanlış' bir aralığa dayandırdığınız X'i gözlemleyeceksiniz)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.