Güvenilir bölgeler ile Bayesian hipotez testleri arasındaki bağlantı nedir?


38

Sık sık istatistiklerde, güven aralıkları ve testler arasında yakın bir bağlantı vardır. İlgili çıkarımda kullanarak μ içinde N(μ,σ2) bir örnek olarak dağılım, 1α güven aralığı ,t-testitarafındanαanlamlılık düzeyindereddedilmeyen

x¯±tα/2(n1)s/n
tümdeğerlerini içerir.μtα

Sık sık güven aralıkları bu anlamda tersine çevrilmiş testlerdir. (Bu arada, bu yorumlayabileceğimiz anlamına gelir.p değerini, parametrenin boş değerinin 1 - α güven aralığındayer alacağıen küçük değeri olarak. Bunun, bunun ne olduğunu açıklamanın faydalı bir yolu olabileceğini düşünüyorum. p değerleri gerçekten biraz istatistik bilenlere aittir.)α1αp

Bayesian güvenilir bölgelerinin karar teorik temeli hakkında okurken , inanılır bölgeler ve Bayesian testleri arasında benzer bir bağlantı / denklik olup olmadığını merak etmeye başladım.

  • Genel bir bağlantı var mı?
  • Genel bir bağlantı yoksa, bağlantının olduğu örnekler var mı?
  • Genel bir bağlantı yoksa, bunu nasıl görebiliriz?

Merak ettiğim ilgili bir soru - birisi bana oyuncak örneğinden ziyade gerçek bir problem üzerinde kullanılan Bayesian hipotez testinin "altın standardı" veya "kanonik örneği" olduğunu düşündüğü bir makaleye işaret edebilir. Bayesian hipotez testlerini gerçekten anlamadım ve kullanım öğreticisinin iyi bir örneğini bulacağımı düşünüyorum.
Patrick Caldon

2
@PatrickCaldon Bu konuda bir "altın kağıt" olduğundan şüpheliyim çünkü Bayesian hipotez testleri karar teorik bir çerçevede formüle edildi (bu nedenle tek bir makalede ele geçirilemeyecek kadar geniş). MånsT'ın cevabında belirtilen kitap iyi bir materyal sunuyor, Berger'in kitapları ve konuşmaları da ilgi çekici olabilir.

Ba.stat.cmu.edu/vol03is01.php yazısının burada tartışmamızın çoğunu netleştireceğine inanıyorum .
Carlos AB Pereira

Teşekkürler, @Carlos! Bağlantı şu anda işe görünmüyor, ama neden olduğunu tahmin senin 2008 kağıt içinde Bayes Analizi Stern ve Wechsler ile. Bunu çok ilginç bir okuma buldum!
MånsT

Sayın MånsT: Bayesian Analizi Euclid Projesi'ne taşındı. Carlos gazetesi burada: projecteuclid.org/…
Zen

Yanıtlar:


19

Bir bağlantının var olduğu bir örnek bulmayı başardım . Bu benim büyük ölçüde kayıp işlev seçimime ve buna rağmen bileşik hipotezlerin kullanımına bağlı görünüyor.

Genel bir örnekle başlıyorum, ardından normal dağılım içeren basit bir özel durum izliyor.

Genel örnek

Bilinmeyen bir parametre için , let Θ parametre uzayı olmak ve hipotez dikkate İçeride ISTV melerin RWMAIWi'nin İçeride ISTV melerin RWMAIWi'nin 0 alternatif karşı İçeride ISTV melerin RWMAIWi'nin Θ 1 = Θ Θ 0θΘθΘ0θΘ1=ΘΘ0 .

Let , bir test fonksiyonu bulunan gösterim sistemini kullanarak Xi'an 'ın Bayes Seçim reddetme böylece, (ben en azından alışkınım ne tür geriye doğru taşımaktadır) İçeride ISTV melerin RWMAIWi'nin 0 ise φ = 0 ve kabul İçeride ISTV melerin RWMAIWi'nin 0 ise φ = 1 . Kayıp fonksiyonu göz önünde L ( θ , φ ) = { 0 , eğer  φ = I İçeride ISTV melerin RWMAIWi'nin 0 ( θ ) bir 0 , eğer  θ İçeride ISTV melerin RWMAIWi'ninφΘ0φ=0Θ0φ=1=1 olur Eğer Bayes testiφπ(x) ise

L(θ,φ)={0,if φ=IΘ0(θ)a0,if θΘ0 and φ=0a1,if θΘ1 and φ=1.
φπ(x)=1ifP(θΘ0|x)a1(a0+a1)1.

Al ve bir 1 = 1 - a . Boş hipotezi Θ 0 , P ( θ Θ 0 | x ) 1 - α ise kabul edilir .a0=α0.5a1=1αΘ0P(θΘ0|x)1α

Şimdi, güvenilir bir bölge , P ( Θ c | x ) 1 - α gibi bir bölgedir . Bu nedenle, tanım gereği Θ 0 , P ( θ Θ 0 | x ) 1 - α ise , Θ c yalnızca P ( Θ 0Θ c | x ) > 0 olduğunda güvenilir bir bölge olabilir .ΘcP(Θc|x)1αΘ0P(θΘ0|x)1αΘcP(Θ0Θc|x)>0

Boş hipotezi kabul edersek, eğer sadece her güvenilir bölge Θ 0 boş olmayan bir alt küme içeriyorsa kabul ederiz .1αΘ0

Daha basit bir özel durum

Yukarıdaki örnekte ne tür bir test olduğunu daha iyi göstermek için, aşağıdaki özel durumu dikkate alın.

Let ile θ ~ N ( 0 , 1 ) . Takım Θ = R , Θ 0 = ( - , 0 ] ve Θ 1 = ( 0 , ) , böylece test isteyen bu olup İçeride ISTV melerin RWMAIWi'nin 0xN(θ,1)θN(0,1)Θ=RΘ0=(,0]Θ1=(0,)θ0 .

Standart hesaplamalar vermek buradaΦ()standart normal cdf'dir.

P(θ0|x)=Φ(x/2),
Φ()

Let şekilde olması Φ ( z 1 - α ) = 1 - a . Θ 0 olduğunda kabul edilir - x / z1αΦ(z1α)=1αΘ0 .x/2>z1α

Bu, x olduğunda kabul etmeye eşdeğerdirİçinα=0.05,Θ0nedenle zaman reddedilirx>-2.33.x2zα.α=0.05Θ0x>2.33

Bunun yerine, kullanımdan önce halinde , Θ 0 olduğunda reddedilir x > - 2.33 - v'yi .θN(ν,1)Θ0x>2.33ν

Yorumlar

Yanlış sıfır varsayımını kabul etmenin yanlış olduğunu düşündüğümüz yukarıdaki kayıp işlevi, ilk bakışta biraz yapay görünebilir gibi görünebilir. Bununla birlikte, örneğin tehlikeli bulaşıcı hastalıkların veya teröristlerin taranması sırasında “yanlış negatiflerin” pahalı olabileceği durumlarda oldukça yararlı olabilir.

Tüm güvenilir bölgelerin bir kısmını içermesi şartı aslında umduğumdan biraz daha güçlü: sıklık durumunda, yazışma tek bir test ile tek bir test arasında değil, tek bir test arasındaki tek bir 1 - α güven aralığı arasında. ve tüm 1 - α aralıkları.Θ01α1α


2
+1 Güvenilirlik aralığı yerine güvenilirlik bölgesini kullanırdım .

1
Teşekkürler @Procrastinator! Cevabı değiştirdim ve ben varken "bölge" olarak değiştirdim. Çoğunlukla Unimodal posteriorların HPD bölgeleriyle çalışıyorum, bu yüzden güven bölgelerini aralık olarak düşünme eğilimindeyim. :)
MånsT

12

Michael ve Fraijo , ilgilenilen parametre değerinin güvenilir bir bölgede olup olmadığını kontrol etmenin, Bayesian'nin güven güven aralıklarını tersine çevirdiğini gösteriyor . İlk başta bu konuda biraz şüpheliydim, çünkü bu prosedürün gerçekten bir Bayesian testiyle sonuçlandığı açık değildi (her zamanki anlamda).

Görünen o ki, öyle - en azından belirli bir kayıp fonksiyon tipini kabul etmeye istekli iseniz. HPD bölgeleri ve hipotez testleri arasında bağlantı kuran iki bildiriye referans veren Zen'e teşekkür ederiz :

H0:θΘ0={θ0}andH1:θΘ1=ΘΘ0,
Θ

Θ0Θ1

π()θ

T(x)={θ:π(θ|x)>π(θ0|x)}.

T(x)P(θT(x)|x)

Θ0P(θT(x)|x)<0.05θ0Θ05 %95 %

φ1Θ00Θ0

L(θ,φ,x)={a(1I(θT(x)),if φ(x)=0b+cI(θ(T(x)),if φ(x)=1,
a,b,c>0

Θ0P(θT(x)|x)<(b+c)/(a+c).

θ0

x

Bu konuyla ilgili daha fazla bilgi için Madruga ve ark. makale .


Ekim 2012 Güncellemesi:

x

qα(θ|x)θP(θqα(θ|x))=α(qα/2(θ|x),q1α/2(θ|x))Θ0x

Θ0={θ0}Θ0Θ1={θ:θ<θ0}Θ1={θ:θ>θ0}

φ=iΘi01

L2(θ,φ)={0,if θΘi and φ=i,i{1,0,1},α/2,if θΘ0 and φ=0,1,if θΘiΘ0 and φ=i,i{1,1},
Θ0θ0

Bu bana oldukça makul bir kayıp işlevi gibi görünüyor. Ben bu kaybı, Madruga-Esteves-Wechsler kaybını ve arXiv'deki el yazmasında daha ilerideki setleri kullanarak test etmeyi tartışıyorum.


2
(Bunu topluluk wiki olarak işaretliyorum)
MånsT

L:{ParameterSpace}×{Actions}R

@Zen: Evet, elbette, yanlış yazdım. Gösterdiğin için teşekkürler. :)
MånsT

3
@ MånsT: (+1) Bu ilginç bir cevap. Bu örnekte CW olarak işaretlemeyi seçtiniz gerçeğine çok saygı duyuyorum, ancak keşke olmasaydı. :-)
cardinal

8

Bu soruya gelmeden önce arXiv makalenizi tesadüfen okudum ve üzerine bir blog yazısı yazdım ( 08 Ekim'de görünmesi planlanıyor ). Özetlemek gerekirse, teorik olarak ilgi duyduğunuz yapıyı buluyorum, fakat aynı zamanda tavsiye edilemeyecek kadar düşünülmüş olduğunu düşünüyorum. nokta-sıfır hipotezini çözemediği için geleneksel olarak nokta-null parametre değerine bir miktar kütle koyması gereken Bayesian test problemi.

φH0:θθ0H0:θ=θ0

H0Θ0={θ0}


1
1α/2α/2φ=0α/2<min(P(Θ1),P(Θ1))θ0güvenilir bir aralıkta. Bunu arXiv elyazmasında mümkün olan en kısa sürede değiştireceğim!
MånsT

H0

Θ0

1
H0P(θΘi|x)>α/2

3

Bayesian hipotez testleri için güvenilir bir aralık (veya HPD bölgesi) kullanabilirsiniz. Yaygın olduğunu sanmıyorum; Yine de adil olmak için fazla şey görmüyorum ya da uygulamada resmi Bayesian Hipotez Testlerini kullanmıyorum. Bayes faktörleri zaman zaman (ve Robert'in “Bayesian Core” da biraz övgüyle) hipotez testlerinde kullanılır.


1
Alkış @Fraijo! Belki de cevabınızın Michael Chernick’in cevabından ne kadar farklı olduğu hakkında biraz bilgi verebilir misiniz?
MånsT

2
Bayes faktörlerinin hipotez testi için kullanılmasının "ara sıra" olduğunu düşünmüyorum, örneğin bu referansa bakın .

@ MånsT, takip ettiği süreçte Michael'ın tanımladığı süreç Bayes Factor testi gibi görünüyor. Temel olarak, hipotezinize dayanarak farklı önceliğe sahip iki model yaratır ve daha sonra önceliğe dayalı veri setinin olasılığını karşılaştırırsınız. Gönderilen referans Procrasinator bunun hızlı bir şekilde gözden geçirilmesini sağlar.
Fraijo,

1
@Procrastinator Ara sıra söyledim, çünkü endüstrimde, hipotezi test etmek için Bayesian yöntemlerini kullanıp, yalnızca Bayesian yöntemlerini kullanan birkaç kişi görüyorum. Şahsen, modellerimi önceliğe duyarlılık açısından kontrol etmek için Bayes faktörlerini kullanıyorum, sanırım bir tür hipotez testi.
Fraijo,

1
@ MånsT kısa cevap: hayır. Güvenilir bir aralık oluşturmak ve sıfır hipotezi içerip içermediğini bulmak, sıkça yapılan hipotez testleriyle karşılaştırılabilir tek doğrudan testtir. Bu yöntemle ilgili iki sorun vardır: 1) bazı durumlarda birden fazla bölge bulabileceğinizin açık olduğu (örneğin bir simetrik bölgeye karşı bir HPD) ve 2) bir nokta hipotezini test etme (theta = a) Bayesian parametrelerinin idealiyle çakışıyor dağılımları alarak (p = P (teta)).
Fraijo

1

Güvenilir bir bölge, arka yoğunluğun bölge üzerindeki integralinin belirlenmiş bir olasılık olduğu, örneğin 0,95 olduğu bir bölgedir. Bir Bayesian hipotez testi oluşturmanın bir yolu, parametre (ler) in boş varsayılmış değer (ler) inin güvenilir bölgeye düşüp düşmediğini görmektir. Bu yolla, hipotez testleri ile aynı sıklıktaki kişilerin güven aralıkları ve hipotez testleri ile yaptığı gibi güvenilir bölgeler arasında benzer bir 1-1 yazışma yapabiliriz. Ancak hipotez testi yapmanın tek yolu bu değil.


Bu tür ad hoc Bayesian testleri pratikte sıklıkla kullanılıyor mu?
MånsT

1
@MansT Sanmıyorum. Ben genellikle Bayesanların boş hipotezin doğru olup olmadığına dair önceden bir ihtimal koyduğunu düşünüyorum ve daha sonra posterior olasılıkları üzerine inşa ettik. Eğer arka oranlar boş hipoteze karşı fırtınalıysa o zaman reddedilir. Ben sık sık Bayesian çıkarım yapmadığım için sormam gereken en iyi insan değilim.
Michael Chernick

2
Michael tarafından açıklanan test, Bayesian ekonometri konusundaki kitabında Zellner tarafından Lindley'e yatırılmaktadır.
Zen,

1
Evet, bu tür testler kesinlikle Bayesian fikirlerinden kaynaklanıyor , ancak Bayesian karar teorisinde sağlam bir temeli olup olmadığından emin değilim . İkinci ayarda, testlerin tipik olarak bir test fonksiyonunu içeren bir kayıp fonksiyonundan türetilmesini beklerdim.
MånsT


-1

Bana verelim bunu nasıl aldığını okuma Tim'in cevabı .

Sütunlardaki hipotezli (tahmini parametre) tablo görünümlerine ve satırlardaki gözlemlere dayanmaktadır .

görüntü tanımını buraya girin

İlk tabloda, toplamda 1 olan sütun olasılıklarınız var, yani bunlar koşul olayını sütun olayına girmeden önce 'önceki' olarak adlandırılan koşullu olasılıklardır. Son tabloda, satırlar 1'e benzer şekilde toplanır ve ortada ortak olasılıklara sahip olursunuz, yani ilk ve son tabloda çarpı olasılık olasılığını, önceliğini bulduğunuz koşullu olasılıkları.

Tablolar temel olarak Bayesian dönüşümü gerçekleştirir: ilk tabloda, her sütunda gözlemlerin (satırların) pdf'sini, bu hipotez için önceliğin (evet, hipotez sütununun, bu hipotezin altındaki gözlemlerin pdf'si) verdiğini, Her sütun ve masa için önce ortak olasılık tablosuna, ardından gözlemlerle koşullandırılmış hipotezinizin olasılıklarına girer.

Tim'in cevabından aldığım gibi (yanılıyorsam düzelt), Kritik Aralık yaklaşımı ilk tabloya bakar. Yani, deney tamamlandıktan sonra, tablonun satırını biliyoruz (benim örneğimde baş veya kuyruklar var, ancak 100 jeton çevirme ve 2 ^ 100 satırlı bir masa almak gibi daha karmaşık deneyler yapabilirsiniz). Frequentialist, söylediğim gibi, hipotezin doğru soğuk olması koşuluyla olası sonuçların bir dağılımı olan sütunlarını inceler (örn. Madeni para benim örneğimde adildir) ve bu konuda çok düşük olasılık değeri veren hipotezi reddeder. gözlenen sıra.

Bayesyenist ilk önce olasılıkları ayarlar, satırları dönüştürür ve tablo 3'e bakar, gözlemlenen sonucun sırasını bulur. Aynı zamanda bir pdf olduğundan, deneme sonucu satırından geçer ve% 95'lik güvenilirlik cebi doluncaya kadar en yüksek prob hipotezini alır. Hipotezin geri kalanı reddedildi.

Beğendiniz mi? Hala öğrenme sürecindeyim ve grafik bana yardımcı oluyor. İki yaklaşımın farklılığını analiz ederken saygın bir kullanıcı aynı resmi verdiğinden beri doğru yolda olduğuma inanıyorum . Hipotez seçiminin mekaniğinin grafiksel bir görünümünü önerdim.

Herkesi Keith'in son cevabını okumasını teşvik ediyorum, ancak hipotez test teknisyeni resmim derhal şu ​​anki cevabı doğrularken frekansçıların başka bir hipoteze bakmadığını söylerken, yüksek güvenilirlik hipotezinin dikkate alınmasının bayesce'deki diğer hipotezlerin kabul edilmesini / reddedilmesini oldukça etkilediğini söyleyebilirim. analizler, çünkü gözlemlenen verilerde zamanın% 95'ini oluşturan tek bir hipoteziniz varsa, verinin içinde ne kadar iyi olduğuna bakılmaksızın, hemen hemen tüm diğer hipotezleri atarsınız. Güven aralıkları ile örtüşen iki hipotezi tezat eden istatistiksel güç analizini bir kenara bırakalım.

Ancak, iki yaklaşım arasındaki benzerliği tespit etmiş gibiyim: P(A | B) > P(A) <=> P(B|A) > P(B)mülkle bağlanmış gibi görünüyorlar . Temel olarak, eğer A ve B arasında bir bağımlılık varsa, o zaman hem frekans hem de bayes tablolarında korelasyon olarak görünecektir. Bu yüzden, bir hipotez testi yapmak diğer ile ilişkilendirilirse, aynı sonuçları vermeleri gerekir. Korelasyonun köklerini incelemek, muhtemelen ikisi arasındaki bağlantıyı verecektir. Benim sorum var aslında ben neden mutlak korelasyon yerine farkın olduğunu soruyorum?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.