P-değerinin iki tanımı: denklikleri nasıl kanıtlanır?


11

Larry Wasserman'ın Tüm İstatistikler kitabını ve şu anda p değerleri hakkında okuyorum (sayfa 187). Önce bazı tanımları sunayım (alıntı yapıyorum):

Tanım 1 ret bölgesi olan bir testin gücü fonksiyonu ile tanımlanır bir test boyutu olarak tanımlanır bir test seviyesi olduğu söylenir \ alfa boyutu daha az ya da buna eşit göre ise \ alfa .R

β(θ)=Pθ(XR)
α=supθΘ0β(θ)
αα

Bu temelde α , boyutun I tipi bir hatanın "en büyük" olasılığı olduğunu söyler . Daha sonra p değeri (I alıntı) ile tanımlanır

Tanım 2 Varsayalım ki her \ alpha \ in (0,1) için red_ bölgesi R_ \ alpha olan α(0,1)bir size α testimiz var . Daha sonra, R_ \ alpha \} içindeki p \ text {-value} = \ inf \ {\ alpha: T (X ^ n) \ burada X ^ n = (X_1, \ dots, X_n) .Rα

p-value=inf{α:T(Xn)Rα}
Xn=(X1,,Xn)

Benim için bu şu anlama gelir: belirli bir α verildiğinde bir test ve ret bölgesi Rα böylece α=supθΘ0(α)Pθ(T(Xn)Rα) . İçin p ben sadece o zaman bütün bu küçük almak-değeri α .

Soru 1 Bu durumda, keyfi olarak küçük \ epsilon için \ alpha = \ epsilon'u seçebilirim . Tanım 2'nin yanlış yorumum nedir, yani tam olarak ne anlama geliyor?α=ϵϵ

Şimdi Wasserman sürekli ve tanıdığım p değeri "eşdeğer" tanımına sahip bir teorem belirtiyor (Ben alıntı):

Teoremi boyutu Varsayalım ki test formunun olan Daha sonra, burada , gözlenen değeridir .α

reject H0T(Xn)cα
p-value=supθΘ0Pθ(T(Xn)T(xn))
xnXn

İşte ikinci sorum:

Soru 2 Bu teoremi nasıl ispatlayabilirim? Belki de değerinin tanımını yanlış anladığımdan dolayı , ama anlayamıyorum.p


4
Bu olumlu bu tuhaf Wasserman tanımlamak bu güç "olarak sembolü için," , neredeyse evrensel (yani enerji = 1- tip II hata oranı için kullanılır hemen hemen herhangi bir başka yazar ele güç için). Kasten buna neden olmak dışında kötü bir karışıklık yaratabilecek bir gösterim seçeneği hayal etmekte zorlanıyorum. βββ
Glen_b

1
Bunun garip olduğunu kabul ediyorum Glen - ancak Casella ve Berger aynı şeyi yapıyorlar ve metinleri bence istatistiksel teorinin altın standardı.
Matt Brems

Yanıtlar:


6

dağılımından bilinmeyen bazı parametreler ile çizilen bazı çok değişkenli veriler var . örnek sonuçlar olduğunu unutmayın .xDθx

Bilinmeyen bir parametre hakkında bazı hipotezleri test etmek istiyoruz , boş hipotez altındaki değerleri kümede .θθθ0

Uzaydaki , bir red bölge tanımlayabilir ve bu bölge gücü aşağıdaki gibi tanımlanır . Güç Böylece hesaplanan belirli bir değeri için arasında olasılık olarak örnek sonuç olduğunu reddi bölgesi içinde zaman değeri isimli . Açıkçası, güç ve seçilen .XRRPθ¯R=Pθ¯(xR)θ¯θxR θθ¯Rθ¯

Tanım 1 tanımlar bölge boyutuR tüm değerlerinin Supremum olarak için içinde , yani sadece değerleri için altında . Tabii ki, bu bölgede bağlıdır, böylece .Pθ¯Rθ¯θ0θ¯H0αR=supθ¯θ0Pθ¯R

Şöyle bağlıdır başka bir değer bölge değişiklikleri vardır ve bu, p-değeri tanımlamak için temel oluşturur: Örnek gözlenen değeri hala için bölgeye ait olduğu değişim bölgesi, ancak bu tür bir şekilde her bir bölge, hesaplamak yukarıda tanımlandığı gibi ve infimum alır: . Dolayısıyla p değeri, içeren tüm bölgelerin en küçük boyutudur .αRRαRpv(x)=infR|xRαRx

Teoremi bunun sadece bir 'çeviri', bölgeler, yani durum daha sonra , bir istatistik kullanılarak tanımlanır ve bir değer için bir bölge tanımlamak olarak . Yukarıdaki muhakemede bu tür bölgesini kullanırsanız , teorem takip eder.RTcRR={x|T(x)c}R

Yorumlar nedeniyle DÜZENLE:

@ user8: teorem için; Eğer boyuttaki bir red bölgesi teoremi olarak ret bölgeleri tanımlarsak bir dizi böyle görünüyorBazı için .αRα={X|T(X)cα}cα

Gözlemlenen değeri p-değerini bulmak için , yani en küçük bölgesi bulmak zorunda , örneğin, en büyük değeri , öyle ki hala içerir , ikincisi (bölge içerir ) (bölgelerin tanımlanma şekli nedeniyle) eşdeğerdir , bu nedenle büyük şekildexpv(x)Rc{X|T(X)c} xxcT(x)c{X|T(X)c&cT(x)}

Açıktır ki, en büyük şekilde olmalıdır ve daha sonra, yukarıda olurccT(x)c=T(x){X|T(X)c=T(x)}={X|T(X)T(x)}


Cevabınız için çok teşekkürler. Teoremin doğrulanması ile ilgili soru için: Bir şekilde bir over eksik değil mi? infα
matematik

@ user8: Cevabımın sonuna bir paragraf ekledim, şimdi sonsuz olanı görüyor musunuz?

7

Tanım 2'de, bir test istatistiğinin değeri, tüm en büyük alt sınırıdır, öyle ki hipotez testi için reddedilir . ne kadar küçük yaparsak , izin verdiğimiz Tip I hataya daha az tolerans olduğunu hatırlayın , bu nedenle red bölgesi da azalacaktır. Yani (çok) gayri resmi olarak, değeri seçebileceğimiz en küçük , yine de gözlemlediğimiz veriler için reddetmemize izin verir . Keyfi olarak daha küçük bir çünkü bir noktadapαααRαpαH0αRα o kadar küçük olacak ki, gözlemlediğimiz olayı hariç tutacak (yani içeremez).

Şimdi, yukarıdakilerin ışığında, sizi teoremi yeniden düşünmeye davet ediyorum.


Hala biraz kafam karıştı. İlk olarak, tanım istatistiği için sabit midir? İfadenize katılmıyorum: "... bir noktada, o kadar küçük olacak ki gözlemlediğimiz olayı dışlayacak (yani içeremez)." Mükemmel bir şekilde, eğer gözlemlenen numuneyi içermeyecek kadar küçükse, reddetmeyiz . Bununla ilgili sorun nedir? yardım / sabır için teşekkürler2TαRαRαH0
matematik

Evet. Test istatistiği , numunenin önceden belirlenmiş bir sabit fonksiyonudur, burada "sabit", fonksiyon formunun herhangi bir için değişmediği anlamına gelir . Aldığı değer örneğe bağlı olabilir (ve olması gerekir). " " , anlaşmazlığınızın neden yanlış olduğunu ortaya koyuyor: tanım gereği , , test istatistiklerinin null değerini reddetmesine neden olan tüm değerler kümesini içerir . Yani etiketlenmiş yüzden var "R" fırlatma Bora'nın. Cevabımı daha ayrıntılı olarak açıklamak için bir güncelleme yayınlayacağım. TαH0RαR
heropup

Hızlı yanıtınız ve güncellenmiş sürümünüz için şimdiden çok teşekkürler. Demek istediğim şuydu: ise reddediyoruz , burada gözlenen örnektir. Çok aşırı olduğumu söyleyin ve çok küçük seçin, böylece verilen örneği için reddetmediğimiz anlamına gelir . Yani küçük bir apriori kötü bir şey değil. Açıkçası, bir noktada o kadar küçük ki, ait bir örneği gözlemlemek çok olası değildir . Tekrar, sabrınız / yardımınız için teşekkürler. gerçekten takdir! H0T(xn)RαxnRαT(xn)RαH0RαRα
matematik

2
Verilen p-değeri tanımı, örneğin ret bölgesinde olması için test istatistiğini açıkça gerektirir . P-değeri tanımının o kısmını değiştirmekte özgür değilsiniz.
Glen_b

@Glen_b Yorum için teşekkürler. Gerçekten, önceki yorumum tanımı ihlal ediyor. Gösterdiğiniz için teşekkürler.
matematik
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.