Bayes tahmincisi seçim önyargısına karşı bağışıktır


11

Bayes tahmincileri seçim yanlılığından muaftır?

Tahminleri, örneğin tüm genom dizisi verileri gibi yüksek boyutta tartışan çoğu makale sıklıkla seçim yanlılığı konusunu gündeme getirecektir. Seçim yanlılığı, binlerce potansiyel öngörücümüz olmasına rağmen, sadece birkaçının seçileceği ve seçilen birkaçında çıkarımın yapıldığı gerçeğinden kaynaklanmaktadır. Böylece işlem iki adımda gerçekleşir: (1) öngörücülerin bir alt kümesini seçin (2), seçim kümeleri üzerinde çıkarım yapar, örneğin tahmin oran oranları. Dawid 1994 paradoks belgesinde tarafsız tahmin ediciler ve Bayes tahmin edicileri üzerinde durdu. Bir tedavi etkisi olabilecek en büyük etkiyi seçme problemini basitleştirir. Sonra tarafsız tahmin edicilerin seçim yanlılığından etkilendiğini söylüyor. Örneği kullandı: sonra her birini varsayalım

ZiN(δi,1),i=1,,N
Zi için . Let , tahmin (ancak bastırılmaktadır pozitif) \ max \ {\ delta_1, \ delta_2, \ ldots, \ delta_N \} için . Bu ifade Jensen eşitsizliğiyle kolayca kanıtlanabilir. Bu nedenle, en büyük \ delta_i dizini olan i _ {\ max} 'i bilseydik , tahmincisi tarafsız olan Z_ {i _ {\ max}}' ı kullanırız . Ancak bunu bilmediğimiz için, bunun yerine (pozitif) önyargılı olan \ gamma_1 (\ mathbf {Z}) kullanıyoruz.δiZ=(Z1,Z2,,ZN)T
γ1(Z)=max{Z1,Z2,,ZN}
max{δ1,δ2,,δN}imaxδiZimaxγ1(Z)

resim açıklamasını buraya girin

Ancak Dawid, Efron ve diğer yazarların endişe verici ifadesi Bayes tahmincilerinin seçim yanlılığına karşı bağışık olduklarıdır. Bundan önceki koymak ise , ki , Daha sonra Bayes tahmin ile verilir burada , ile standart Gaussian.δiδig(.)δi

E{δiZi}=zi+ddzim(zi)
m(zi)=φ(ziδi)g(δi)dδiφ(.)

Biz, yeni tahmincisi tanımlarsak olarak ne olursa olsun seni tahmin etmek seçmek ile , seçim aynı olur. Bu, monoton olduğu için . Ayrıca biliyoruz ki daraltır terimiyle sıfıra doğru,δimax

γ2(Z)=max{E{δ1Z1},E{δ2Z2},,E{δNZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δiZi}Ziddzim(zi)bu da pozitif yanlılığın bir kısmını azaltır . Ancak Bayes tahmincilerinin seçim yanlılığına karşı bağışık olmadığı sonucuna nasıl ulaşabiliriz. Gerçekten anlamıyorum.Zi

1
Bir literatürde bir hak talebine atıfta bulunduğunuz göz önüne alındığında, bu hak talebinin tüm içeriğini okuyabilmemiz için lütfen tam bir durum ve sayfa referansı verebilir misiniz?
Ben - Monica

Bir tahmin ediciyi, Bayes tahmincisinin maksimum değeri olarak tanımlamak hala bir Bayes tahmincisi mi?
Xi'an

Örnek 1.
Chamberlain Foncha

Yanıtlar:


4

Yukarıda açıklandığı gibi, sorun, Normal rvs örneğinin en büyük ortalaması olan indeks ve değer (i⁰, μ⁰) üzerinde çizim çıkarımıyla ilgilidir. Dawid'in sunumunda şaşırtıcı bulduğum şey, Bayes analizinin o kadar Bayesci gelmediğidir. Tüm örnek verilirse, Bayesci bir yaklaşım, i steps tahmininden ilişkili ortalamayı tahmin etmeye kadar, tahmin adımlarını takip etmek yerine (i⁰, μ⁰) üzerinde bir posterior dağılım üretmelidir. Gerekirse, tahminciler belirli bir kayıp fonksiyonunun tanımından gelmelidir. Bunun yerine, örnekteki en büyük nokta ve sadece bu nokta, dağılımı değiştiğinde, bu yüzden hiçbir ayarlama gerekli olmadığı ifadesi ile oldukça şaşkınım.

Önceki modelleme aynı zamanda, araçlardaki önceliklerin bağımsız Normallerin bir ürünü yerine eklem olması gerektiğinden oldukça şaşırtıcıdır, çünkü bu araçlar karşılaştırılır ve dolayısıyla karşılaştırılabilir. Örneğin, tüm verilerden konum ve ölçek tahmin edilecek şekilde, hiyerarşik bir önceki daha uygun görünmektedir. Araçlar arasında bir bağlantı oluşturulması ... Bağımsız uygun olmayan önceliklerin kullanımına ilişkin bir itiraz, maksimum ortalama μ⁰'nin iyi tanımlanmış bir ölçüye sahip olmamasıdır. Ancak, bazı önceliklerin diğerlerine karşı eleştirilmesinin bu "paradoks" a ilgili bir saldırı olduğunu düşünmüyorum.


1
Bana, tüm korumanın bilinmeyen tüm araçları bağlayandan önce kodlanması gerektiğini söylüyor. Eğer öncekiler araçlar arasında büyük farklar yaratmazsa, bu onu mükemmel kılan arkaya yansıyacaktır.
Frank Harrell

@ Xi'an a nasıl öncülük yapacağınıza dair bir örnek verebilir misiniz ? (i,μ)
Chamberlain Foncha

@Frank Harrel, örneğin ve . Tarafsız tahmincisi olduğunu . Arasında Bayes tahmincisi olan . Eğer en büyük ise , çünkü Bayes tahmincisi . Öncesi ne kadar bilgilendirici olursa olsun, bu değişmeyecektir. Ancak, , içindeki pozitif Bayes'i azaltır . Ancak yanlış seçilirse, Bayes tahmincisi bunu düzeltemez.δiN(a,1)ZiN(δi,1)δiZiδiE(δi|Zi)Zi0ZiE(δi0|Zi0)ZiE(δi0|Zi0)Zi0i0
Chamberlain Foncha

@ChamberlainFoncha: Bayes tahmin sadece zaman sitesindeki önsel bağımsızdır. ve 'den önceki bir eklem onları aslında bağımlı hale getirir. E[δi|Zi]δiiμi
Xi'an

Ve daha önce herhangi bir Bayesci bakış açısından kabul edilebilir, örneğin, indeks üzerinde tekdüze bir dağılım ve ' önce bir hiyerarşik . μi
Xi'an

1

Biraz sezgisel olsa bile ifade doğrudur. Bu deney için olduğunu varsayalım , için posterior gerçekten . Bu sezgisel gerçek, Bayes'in (gizli) erken durmaya karşı bağışık olmasına (biraz da sezgisel) biraz benzer.i=5μ5N(x5,σ2)

Bayesian akıl yürütme, bu tür her deney için (birkaç kez tekrarladığınızı hayal edin), sadece en iyi çeşitliliğin sonuçları korunursa yanlış sonuçlara yol açacaktır. Veri seçimi olacaktır ve Bayesian yöntemleri açıkça (gizli) veri seçiminden muaf değildir. Aslında hiçbir istatistiksel yöntem veri seçiminden etkilenmez.

Böyle bir seçim yapılmışsa, bu seçimi dikkate alan eksiksiz bir Bayes mantığı, illüzyonu kolayca düzeltir.

Ancak "Bayes tahmincisi seçim yanlılığına karşı bağışıktır" cümlesi biraz tehlikelidir. "Seçim" in, örneğin açıklayıcı değişkenlerin seçimi veya veri seçimi gibi başka bir şey ifade ettiği durumları hayal etmek kolaydır. Bayes buna açıkça bağışık değil.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.