Bir Bayesian, sabit bir parametre değeri olduğunu kabul eder mi?


39

Bayesian veri analizinde, parametreler rastgele değişkenler olarak değerlendirilir. Bu, Bayesian'nin öznel olasılık kavramsallaştırmasından kaynaklanmaktadır. Fakat Bayesanlar teorik olarak 'gerçek dünyada' tek bir sabit parametre değerinin olduğunu kabul ediyor mu?

Açık bir cevap 'evet' gibi gözüküyor, çünkü parametreyi tahmin etmeye çalışmak neredeyse saçma olacak. Bu cevap için yapılan akademik bir alıntı büyük ölçüde takdir edilecektir.


2
Bana bu parametreyi ver ve bunun için bir dağılım tanımlayacağım. :-)
Anne van Rossum,

Yanıtlar:


42

IMHO "evet"! İşte Grönland'ın en sevdiğim alıntılarından biri (2006: 767):

Sık sık (yanlış) 'parametrelerin, frekansçı tarafından sabit, ancak Bayes tarafından rastgele olarak ele alındığı' söylenir. Hem sık sık hem de Bayesanlar için, bir parametrenin değeri başlangıçtan itibaren sabitlenmiş olabilir veya fiziksel olarak rastgele bir mekanizmadan üretilebilir. Her iki durumda da, ikisinin de bilmek istediğimiz sabit bir değere sahip olduğunu varsayalım. Bayesian, bu değer hakkındaki kişisel belirsizliği ifade etmek için resmi olasılık modellerini kullanıyor. Bu modellerde 'rastgelelik', parametrenin değeri hakkındaki kişisel belirsizliği temsil eder; parametrenin bir özelliği değildir (parametreyi üreten mekanizmaların özelliklerini tam olarak yansıtmasını ummamız gerekir)

Grönland, S. (2006). Epidemiyolojik araştırmalara yönelik Bayesyen perspektifler: I. Temeller ve temel yöntemler. Uluslararası Epidemiyoloji Dergisi , 35 (3), 765-774.


2
Biraz çelişkili olmak, bir parçacığın (konum, momentum) tahmin etmeye çalışacağımız bir "parametre" olduğunu iddia edemez mi? Biri, bu parametrenin "sabit" bir değeri olmadığını ve bunu gerçekten bir dağıtım olarak görmemiz gerektiğini iddia edebilir. Bilinmeyenleri özellikle sabit değerler yerine dağılımlar olarak görmek, doğanın belirli durumlarda yaptığı gibi görünmektedir. Bu akıl yürütmenin pratikte bir Bayesian için çok çekici olduğunu düşünmüyorum, ancak OP'leri tam olarak yanıtlamak için rastgele doğanın bir tartışması gerektiğini düşünüyorum.
adam

3
Bir dağılımı çıkarım hedefi olarak kabul etmenin neyin “kayıtsız” olduğunu anlamıyorum. Gerçekten de, şeyleri parametrelerle indekslemek yine de isteğe bağlıdır, örneğin biri doğrudan işlevler üzerindeki dağılımları kullanarak birisinin belirsizliğini ortaya koyabilir (bkz. Neal ve Gaussian Proseslerinde Williams). Ve birinin olasılık hesabıyla belirsizliği temsil etmek için herhangi bir “rastgelelik” görüşüne sahip olması gerekmez. Tartışmalı (teori) örnekleme dayalı çıkarım yok böyle bir teori gerekir, ancak bildiğim kadarıyla gördüğünüz gibi Bayesianism değil (ya da en azından olması gerekmez.)
conjugateprior

2
Bir Bayescanın bir parametrenin sabit bir değeri olduğunu varsaydığı konusunda hemfikir değilim ve sadece parametreyi nokta değil dağıtım olarak tanımlamaya iten kişisel belirsizliği. Cevabımda bu konuda genişlemeye çalıştım. Kişisel / teorik belirsizliğiniz dağıtımın bir parçasıdır , ancak bana öyle geliyor ki, modeliniz temelde model dışında bırakılan ve kişisel öncelikleriniz çok kesin olsa bile bir dağıtım yaratan değişkenler arasında ortalama alıyor.
Wayne

29

Bayesçi olasılık anlayışı mutlaka öznel değildir (Jaynes). Buradaki önemli ayrım, Bayesçenin, parametrenin değeri hakkındaki bilgi durumunu, bir önceki dağılımın makul değeri için bir miktar dağıtımda bazı gözlemlerde yer alan bilgileri özetleme olasılığı ile birleştirerek belirlemeye çalıştığıdır. Dolayısıyla, bir Bayesyen olarak, parametrenin tam olarak bilinmeyen bir gerçek değere sahip olduğu fikrinden memnun olduğumu ve bir posterior dağılımın amacının makul değerleri hakkında bildiklerimi özetlemek olduğunu söyleyebilirim. önceki varsayımlarıma ve gözlemlerime dayanarak.

Şimdi, bir model yaptığımda, model gerçeklik değil. Bu nedenle, bazı durumlarda söz konusu parametre gerçekte var olur (örneğin, bir wombat'ın ortalama ağırlığı) ve bazı sorularda yoktur (örneğin, bir regresyon parametresinin gerçek değeri - regresyon modeli sadece sonucun bir modelidir). sistemi yöneten, gerçekte tam olarak regresyon modeli tarafından ele geçirilemeyen fiziksel yasalar). Yani gerçek dünyada bir gerçek sabit parametre değerinin olduğunu söylemek kesinlikle doğru değil.

Kapak tarafında, çoğu frekans uzmanının istatistik için bir gerçek değer olduğunu söyleyeceğini söyleyebilirim, ancak ne olduğunu bilmiyorlar, ancak tahmin ediciler için tahmin ediciler var ve tahminlerinde güven aralıkları var (bir anlamda). ) farklı değerlerin makul olup olmadığına ilişkin belirsizliklerini ölçmektedir (ancak, sık sık bir olasılık anlayışı, bunları doğrudan ifade etmelerini engellemektedir).


Her zaman "öznel olasılıkların" öznel olduğunu düşündüm çünkü nesnel gerçekliğin bir özelliği yerine (örneğin tam anlamıyla adil olmayan bir zarın ağırlık dağılımı gibi) hesaplamayı yapan deneğin bir özelliğine atıfta bulundular .
nikie,

1
α

Biliyorum ama onlar hala öznel olasılıklar, değil mi? Çünkü onlar hala konunun bazı parametreler hakkındaki bilgisini açıklıyorlar (ki, bir
sıklıkçı için

Mutlaka bir konu yok. Bir robot veya bilgisayar kümesi, aynı hesaplamayı yapabilir ve frekansçı veya nesnelci bir Bayesian yaklaşımı kullanarak da aynı sonuca varabilir. Öyle olursa olsun objektif ziyade sübjektif olmasının nedeni budur hesaplamayı gerçekleştiren öznenin ait, bilginin durumu.
Dikran Marsupial

16

Asıl amacınıza, Bayesian Veri Analizi'nde (3. baskı, 93), Gelman da yazıyor

Bayesian veri analizi perspektifinden, klasik nokta tahminlerini çoğu zaman örtük tam olasılık modeline dayanan kesin veya yaklaşık arka özetler olarak yorumlayabiliriz. Büyük örneklem büyüklüğü sınırında, aslında, klasik maksimum olabilirlik çıkarımı için teorik bir Bayesian gerekçesi oluşturmak için asimptotik teoriyi kullanabiliriz.

Bu yüzden belki de tek gerçek parametre değerleri olduğunu "itiraf etmesi gereken" Bayesliler değil, ancak tahmin prosedürlerini haklı çıkarmak için Bayesci istatistiklerine itiraz etmesi gereken sıkıcılar! (Bunu dil ile sıkıca yanağımda söylüyorum.)

Pr(θ|y)

Ancak, doğada veya sosyal sistemlerde tek parametreler olduğu fikri, basitleştirici bir varsayımdır. Gözlenebilir sonuçlar üreten bazı süslü süreçler olabilir, ancak sistemin inanılmaz derecede karmaşık olduğunu keşfetmek; Tek bir sabit parametre değerinin bulunduğunu varsayalım sorunu önemli ölçüde kolaylaştırır. Bunun, sorunun özünü kestiğini düşünüyorum: Bayesanlar, bu basitleştirmeyi Frequentist’lerin yapması gerekenden daha fazla yapmak için “kabul etmek” zorunda kalmamalı.


Bayesci çıkarımı neden öznel olasılığa dayandırdığını reddettiğinizi açıklar mısınız? Okuduğum giriş metinlerinin (Kruschke, Lynch) hepsi bu şekilde çerçevelenmiş görünüyor. Kısmen öznel mi (öncekinden gelmekte) mi?
ATJ

@ ATJ Umarım bu konuyu açıklığa kavuşturur. Birinin ilerletebileceği başka argümanlar var, ama benim için asıl tutuşma noktası, Bayesian istatistiklerinin, diğer paradigmaların olmadığı şekilde öznel olduğunu ima etmesiydi . Örneğin, Bernd'in teklifindeki karakterizasyona karşı çıkacağım çünkü posterior değişkenlik çerçevesinde tarafsız bir nokta tahmin yöntemini tercih etmek "kişisel" gibi görünüyor.
Monica

@ATJ, tanıtım metinleri yöntemleri motive etmek için bir hikaye anlatıyor. Bu hikaye gibi bir şey aslında yöntemleri motive etmiş olabilir. Ancak bu, hikayenin insanların bu yöntemleri pratikte uygularken yaptıkları varsayımlar üzerinde çok etkili olduğu anlamına gelmez. (Ve hikaye saçma olabilir: Örneğin, istatistiklere dahil olan olasılıkların sıklık açısından tanımlayıcı frekans metinlerinin bazen söylediği şekilde tanımlanabileceği fikri bir anlam ifade etmiyor - Google Alan Hajek'in "15 Argümanları" makaleleri Bu sıkça istatistiklerin işe yaramadığı anlamına gelmez; vardır.)
Mars

8

Süt içmenin çocuğun büyümesine katkısı gibi bir şey için tek bir "gerçek sabit parametre" olduğunu düşünüyor musunuz? Veya bir hastanın vücuduna enjekte ettiğiniz kimyasal X miktarına bağlı olarak bir tümörün boyutundaki azalma için mi? Aşina olduğunuz herhangi bir modeli seçin ve teoride bile her parametre için gerçek, evrensel, kesin ve sabit bir değer olduğuna gerçekten inanıp inanmadığınızı kendinize sorun.

Ölçüm hatasını göz ardı edin, tüm ölçümler tamamen doğru ve sonsuz bir şekilde kesinmiş gibi yapın. Modelinize bakıldığında, her parametrenin gerçekçi bir şekilde belirli bir puan değerine sahip olduğunu düşünüyor musunuz?

Bir modeliniz olduğu gerçeği, bazı ayrıntıları dışarıda bıraktığınızı gösterir. Modelinizde bir miktar kesinti olacaktır, çünkü bir model yapmak için bıraktığınız parametreler / değişkenler üzerinden ortalama değer alıyorsunuz - gerçekliğin basitleştirilmiş bir gösterimi. (Gezegenin 1: 1 haritasını yapmadığınız gibi, tüm ayrıntılarıyla birlikte değil, 1: 10000000 haritasının veya bu tür basitleştirmelerin tümü. Harita bir modeldir.)

Sol dış değişkenler arasında ortalama aldığınızdan dolayı, modelinize eklediğiniz değişkenlerin parametreleri nokta değerleri değil dağılımlar olacaktır.

Bu, Bayesian felsefesinin sadece bir parçası - teorik belirsizliği, ölçüm belirsizliğini, öncelikleri, vb. Görmezden geliyorum - ama bana göre, parametrelerinizin dağılımları olduğu fikrinin, açıklayıcı istatistiklerin sahip olduğu gibi sezgisel bir anlam ifade ettiği görünüyor. dağılımı.


6

Fakat Bayesanlar teorik olarak 'gerçek dünyada' tek bir sabit parametre değerinin olduğunu kabul ediyor mu?

Bence cevap evet. Parametrenin bilinmeyen bir değeri ve önceki dağıtım bu konudaki bilgimizi / belirsizliğimizi açıklar. Bayesian matematiksel modellemesinde, , önceki dağılımın ardından rastgele bir değişkenin gerçekleşmesi olarak kabul edilir.θ 0θ0θ0


2

Bayesianizme gidip deterministik bir evren ile bağlanırsak (içinde 'quantum' kelimesiyle herhangi bir şey söylemeden önce, beni mizah edin ve bunun fizik olmadığını hatırlayın).

Varsayımlarımızı açık hale getirmek:

  1. Deterministik bir evrenin parçası olan ve gözlemleyen bir Bayesian ajanımız var.
  2. Temsilcinin sınırlı hesaplama kaynakları var.

Şimdi, deterministik evren, atomların newtonyalı küçük bilardo topları olduğu yer olabilir. Tamamen kuantum olmayabilir. Diyelim ki öyle.

Ajan şimdi adil bir yazı tura getiriyor. Bunu bir saniye düşünün, adil bir jeton belirleyici bir evrende neyi oluşturur? 50/50 olasılık oranına sahip bir jeton mu?

Ama bu determinist! Yeterli hesaplama gücüyle, yalnızca aynı şekilde çevrilmiş bir madeni para modelini simüle ederek, madeni paranın tam olarak nasıl düşeceğini hesaplayabilirsiniz.

Deterministik bir evrende adil bir madeni para, aynı yoğunlukta bir metal disk olacaktır. Hiçbir güç, bir yüzü diğerinden daha az kapalıyken daha fazla zaman geçirmeye zorlamaz (zarların ne kadar ağır çalıştığını düşünün.)

Böylece ajan adil bir yazı tura getiriyor. Ancak, ajan yeterince güçlü değil. Madalyonun çevrildiğinde nasıl döndüğünü ölçmek için yeterince keskin göze sahip değil, görüyor ama bulanık.

Ve böylece "Bu madeni para% 50 olasılık ile bir kafa inecek" diyor. Bilgi eksikliği olasılıklara yol açar.

Bir madalyonun nasıl atıldığının aşama alanına bakabiliriz. Atma yönüne, atma kuvvetine, madalyonun dönüşüne, rüzgarın hızına ve yönüne ilişkin eksenleri olan büyük ve çok boyutlu bir koordinat sistemi. Bu alandaki tek bir nokta, olası bir tek coinflip'e karşılık gelir.

Ajandan koordinat sisteminde renk vermesini rica edersek, ajanın verilen her atış için kafaların atanma olasılığına karşılık gelen gri tonlu bir gradyanı varsa, her şey gri bir renk tonunu renklendirir.

Eğer kademeli olarak kafaların olasılığını hesaplayabilmek için ona daha güçlü bir iç bilgisayar veriyorsak, daha fazla ayırt edici renklendirme yapabilecektir. Sonunda en güçlü dahili bilgisayarı verdiğimizde, her şeyi bilene dönüştürürken, garip bir dama tahtası etkili bir şekilde boyanır.

Adil paralar olasılıklardan değil, metalden yapılır. Olasılıklar yalnızca hesaplama yapılarında var olur. Bayesian diyor.


-3

Uygun olmayan öncelikler vardır, örneğin, Fishers Bilgi matrisi ile belirli bir ilişkisi olan Jeffreys. O zaman öznel değil.


2
Jeffrey’lerin önceliğinin ve Fisher bilgi matrisi ile ilişkisinin Bayesian çıkarımının öznel olmadığı anlamına geldiğini açıklayabilir misiniz? Anladığım kadarıyla, Jeffrey'i önceden kullanmanın temel nedeni, modelin alternatif parametrelerinin değişmemesidir. Ek olarak, çok boyutlu bir ortamda, bu Jeffrey'lerin önceliği oldukça bilgilendirici olabilir ve sonuçlar tartışmalıdır (Gelman, BDA 3, s. 53). Bu onun 'tarafsızlığını' baltalıyor mu?
Monica

@ user777, elde yoğunluğun parametrelerine dayandığı için amaçtır. Diyelim ki olasılığımı 1 ile çarptım, olasılık için alt jenerasyonum var mı? Çünkü posterior olasılık önceki x olabilirlikle ilişkilidir.
Analist,

Ve sıklık yapanlar da olasılıklarını kullanmak istiyorlarsa Gerçek Modelin Axiom'unu çağırmak zorundalar ... :)
Analist
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.