Bayes tahmincisi, gerçek parametrenin öncekinin olası bir değişkeni olmasını gerektirir mi?


9

Bu biraz felsefi bir soru olabilir, ama işte başlıyoruz: Karar teorisinde bir Bayes tahmincisi riski θ^(x) için θΘ önceki bir dağılımla ilgili olarak tanımlanır π üzerinde Θ.

Şimdi, bir yandan, gerçek için θ veri üretmiş olmak (yani "mevcut"), θ altında olası bir değişken olmalı πörneğin sıfır olmayan olasılık, sıfır olmayan yoğunluk vb. diğer yandan,θ bilinmemektedir, bu nedenle öncekinin seçimi, bu yüzden gerçek θ altında olası bir π Seçtik.

Şimdi bana öyle geliyor ki bir şekilde π öyle ki θolası bir değişiklik olabilir. Aksi takdirde, bazı teoremler geçerli olmazdı. Örneğin, minimax tahmini, en az uygun olana yönelik bir Bayes tahmini olmayacaktır, çünkü etraftaki büyük bir bölgeyi hariç tutarak veθetki alanından. Ancak, bunu garanti etmekθ gerçekten de etki alanında elde etmek zor olabilir.

Yani sorularım:

  1. Genellikle gerçek θ olası bir çeşididir π?
  2. Bu garanti edilebilir mi?
  3. Bunu ihlal eden vakalar en azından bir şekilde tespit edilebilir mi, bu yüzden koşullar geçerli olmadığında minimak gibi teoremlere güvenmez mi?
  4. Gerekmiyorsa, karar teorisindeki standart sonuçlar neden geçerli?

Yanıtlar:


6

Çok güzel bir soru! Gerçekten de "iyi" bir önceki dağılımın "doğru" parametreye pozitif olasılık veya pozitif yoğunluk değeri vermesi mantıklı olacaktırθ0ancak tamamen kararlı bir perspektiften bunun böyle olması gerekmez. Bu "sezgi" ye basit bir karşı örnek

π(θ0)>0
ne zaman gerekli olmalı π() önceki yoğunluk ve θ0parametrenin "gerçek" değeridir, Casella ve Strawderman'ın (1981) mükemmel minimoksite sonucudur : Normal bir ortalama tahmin edilirkenμ tek bir gözlem üzerine xN(μ,1) ek kısıtlama ile |μ|<ρ, Eğer ρ yeterince küçük, ρ1,0567 spesifik olarak, minimax tahmincisi, daha önce (en az elverişli) üniformaya karşılık gelir. {ρ,ρ}, anlamında π eşit ağırlık verir ρ ve ρ (ve ortalamanın başka herhangi bir değeri için hiçbiri μ)
π(θ)=12δρ(θ)+12δρ(θ)
Ne zaman ρen az olumlu olanı artırır, desteğinin arttığını görür ancak sonlu olası değerler kümesi kalır. Ancak posterior beklentiler,E[μ|x], üzerinde herhangi bir değer alabilir (ρ,ρ).

Tartışmanın özü (yorumlara bakınız), Bayes tahmincisinin, π(), özellikleri oldukça farklı olurdu.

Benzer şekilde, kabul edilebilir tahmin ediciler dikkate alındığında, kompakt bir sette uygun bir öncekiyle ilişkili Bayes tahmin edicileri, sınırlı bir desteğe sahip olmalarına rağmen, genellikle kabul edilebilir.

Her iki durumda da, sıklık kavramı (minimumluk veya kabul edilebilirlik), parametrenin "gerçek" değerinde (4. soruya bir cevap getirir), örneğin posterior riske bakmak yerine, olası parametre aralığı üzerinde tanımlanır.

ΘL(θ,δ)π(θ|x)dθ
veya Bayes riski altında
XΘL(θ,δ)π(θ)f(x|θ)dθdx
gerçek değeri içermez θ0.

Ayrıca, yukarıdaki örnekte belirtildiği gibi, Bayes tahmincisi arka ortalama gibi resmi bir ifade ile tanımlandığında

θ^π(x)=Θθπ(θ|x)dθ
ikinci dereceden (veya L2) kayıp, bu tahminci desteği dışında değerler alabilir π bu destek dışbükey değildir.

Bir yana, okurken

gerçek θ'nin veri üretmesi için (yani "var"), θ, π altında olası bir değişken olmalıdır, örneğin sıfır olmayan bir olasılık, sıfır olmayan bir yoğunluğa sahip olmalıdır

Bir öncekinin anlamının yanlış temsil edildiğini düşünüyorum. Önceki dağılımın, parametre değerini gören gerçek bir fiziksel (veya gerçek) mekanizmayı temsil etmesi beklenmemektedir.θ0 tarafından oluşturuldu π ardından bir gözlem x tarafından oluşturuldu f(x|θ0). Birincisi, parametre alanı hakkında önceden bilgi ve parametre hakkındaki öznel inançları içeren ve hiçbir şekilde benzersiz olmayan bir referans ölçüsüdür. Bir Bayes analizi her zaman bu Bayes analizini yapmak için önceden seçilen ile ilişkilidir. Bu nedenle, gerçek parametrenin aşağıdakilerin desteğine ait olması için mutlak bir gereklilik yoktur.π. Açıkçası, bu destek kompakt bağlantılı bir set olduğunda,A, parametrenin küme dışındaki herhangi bir değeri A posterior ortalama ile tutarlı bir şekilde tahmin edilemez θ^π ancak bu, tahmin edicinin kabul edilebilir olmasını bile engellemez.


Son noktanla ilgili olarak, beni şaşırtan şey budur: μyeterince küçük bir negatif sayı olmak. Eğer garip bir nedenden ötürü bir günlük-normal koyarsam (destek[0,+)) tarihinde μ(ne kadar mantıklı olursa olsun), böyle bir önceliğe sahip bir Bayes tahmincisi mutlaka olması gereken minimax tahminden daha kötü olacaktır. Ama belki de burada bir şeyi yanlış yorumluyorum ...
user32849

1
Genellikle, en az olumlu olan Berger (1985), minimax riskine karşılık gelir.
Xi'an

1
Burada gerçekten kafam karıştı: kitabınız (bölüm 2) θπ(θ)ve özellikle, teorem 2.4.17'de, Θ=[m,m]burada, en az olumlu olan, Θ. Ama sanırım sayfa 10'u daha dikkatli
okumalıydım

1
Entegre risk hiçbir aşamada "true" parametresini içermez. Yani bu anlamda önemli değil.
Xi'an

1
Dolayısıyla, bir anlamda, risk gerçekte yaşadığımız kaybı değil, beklediğimiz kaybı yakalar. Bu çok yardımcı oldu, çok teşekkür ederim!
user32849

8
  1. Evet, genellikle doğru olanın θöncekinin alanında. Durumun böyle olduğunu görmek istatistikçi sorumluluğundadır.

  2. Genellikle, evet. Örneğin, bir ortalama veya konum parametresini tahmin ederken,(,)etki alanında gerçek değere sahip olur. (Parametrenin sıfırdan büyük olduğu biliniyorsa, örneğin "Körfez Köprüsü'ndeki günlük ortalama trafik kazası sayısı", öncekinin negatif değerler içermesi gerekmez.) Bir olasılık tahmin edersek, öncesinde[0,1]etki alanında gerçek değere sahip olur. Bir varyans terimiyle bir önceki değer oluşturuyorsak,(0,) kendi alanında gerçek değere sahip olacak ... vb.

  3. Posteriorunuz öncekinin etki alanının bir kenarında "yığılmışsa" ve öncekiniz aynı kenardaki etki alanına gereksiz bir kısıtlama getiriyorsa, bu gereksiz kısıtlamanın size sorunlara neden olabileceğini gösteren geçici bir göstergedir. Ancak bu yalnızca a) formu, gerçek ön bilgi yerine büyük ölçüde kolaylık tarafından yönlendirilen bir önceliği inşa ettiyseniz ve b) öncekinin kolaylık kaynaklı formu, parametrenin etki alanını, doğal "etki alanı olarak kabul edilebilir.

Bunun bir örneği, potansiyel hesaplama güçlüklerinden kaçınmak için öncekini sıfırdan biraz uzakta bir varyans terimine bağlama eski, umarım uzun süredir kullanılmayan bir uygulamadır. Varyansın gerçek değeri bağlı ve sıfır arasındaysa, iyi ... ama aslında verilerde verilen varyansın potansiyel değerleri hakkında düşünmek veya (örneğin) önceliği bunun yerine varyans günlüğüne koymak, Bu sorundan kaçınmanız gerekir ve benzer hafif zeka, genel olarak alan sınırlayıcı önceliklerden kaçınmanıza izin vermelidir.

  1. Yanıtlayan # 1.

2
Kim cevap vermezse onu reddetti - neden "yararlı değil"?
jbowman

3

Basit, sezgisel cevap olmasıdır öncesinde hakkında ön bilgi yansıtırθve sahip olmanız gereken asgari bilgi, onun alanıyla ilgilidir. Önceden sınırlı kullanırsanız, sınırların dışındaki değerlerin sıfır olasılığa sahip olduğunu, imkansız olduğunu ve iyi bir gerekçe olmadan yapılmaması gereken çok güçlü bir varsayım olduğunu varsayarsınız. Bu yüzden güçlü ön varsayımlar yapmak istemeyen insanlar,- için .

Sınırlı davanın yanı sıra, numuneniz büyüdüğünde veya daha kesin olarak daha fazla bilgi ilettiğinde, posteriorunuz nihayet θ ne olursa olsun .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.