Verilerin öncelikleri dikte etmesine izin verin ve ardından bu öncelikleri kullanarak modeli çalıştırın? (örneğin, aynı veri kümesinden veriye dayalı öncelikler)


9

Anladığım kadarıyla, analiz ettiğimiz veri kümesine, Bayesian analizinde önceki dağılımların nasıl göründüğünü tanımlamak / tanımlamak için izin vermemeliyiz. Özellikle, bir Bayes analizi için önceki dağılımları tanımlamak, daha sonra bir modele uymak için öncekileri kullanacağınız aynı veri kümesinden özet istatistiklere dayanarak tanımlamak uygun değildir.

Herkes bunu uygunsuz olarak özel olarak tartışan kaynakları biliyor mu? Bu sorun için bazı alıntılara ihtiyacım var.


Yanıtlar:


11

Evet bu uygun değildir, çünkü aynı verileri iki kez kullanır, bu da hatalı aşırı güvenilir sonuçlara yol açar. Bu 'çift daldırma' olarak bilinir.

Referanslar için Carlin ve Louis (2000) ile başlayacağım. 'Çift daldırma', Ampirical Bayes'in birincil eleştirilerinden biri olmasına rağmen, Ch. Şekil 3, özellikle bu bölüm 3.5, EB yaklaşımını kullanarak uygun güven aralıklarını tahmin etmenin yollarını açıklar.

Berger J (2006). \ Objektif Bayes Analizi Örneği. "Bayes Analizi, 1 (3), 385 {402

Bradley P. Carlin, Thomas A. Louis 2000. Veri analizi için Bayes ve Ampirik Bayes yöntemleri.

Darniede, WF 2011. Veriye Bağlı Öncelikler İçin Bayesci Yöntemler. Yüksek Lisans Tezi, Ohio State Üniv.

Gelman, A., Carlin, JB, Stern, HS ve Rubin, DB (2003), Bayesian Veri Analizi, İkinci Baskı (İstatistiksel Bilimde Chapman & Hall / CRC Metinleri), Chapman ve Hall / CRC, 2. ed.


@sarah Sorunuzu geri almak için lütfen hesabınızı kaydedin. Sadece şu url'yi ziyaret edin: stats.stackexchange.com/users/login

1

Gerçi önceki verileri oluşturmak için verileri kullanmak mantıklı olabilir.

Karışım modellemesine bir örnek için bakınız Richardson & Green (1997): http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.3667

Veri noktalarının ortalamasını ve aralığını öncekiler için hiperparametreler olarak kullanırlar ve bu mükemmel bir anlam ifade eder.

Verileri iki kez kullanma sorunu, bence önceden bilgilendirici verilerden elde edildiğinde ortaya çıkar.

Önceki dağılımınızın posterior dağılımın zirve yaptığı yerde "düz" olup olmadığını kontrol ettiğiniz sürece, önceki dağıtımınızın sonuçlar üzerinde güçlü bir etkisi olmadığını bilirsiniz.


Öncekileri oluşturmak için verilerin kullanılması Bayes paradigması içinde yer alamaz. Dolayısıyla Bayes perspektifinden bir anlam ifade etmiyor ve Bayes prosedürlerinin olağan validasyonu geçerli değil. Ortaya çıkan çıkarım mükemmel bir şekilde geçerli olabilir ancak kişi ilk ilkelerden göstermek zorundadır. (Richardson ve Green ampirik Bayes denileni kullanırlar. Bu Bayes usulü değildir.)
Xi'an

Bayes paradigması içinde bir anlam ifade etmese de, bazen veri ve önceki şey arasındaki ayrım çizgisi çizmek zor olur. Stats.stackexchange.com/questions/112451/…
kjetil b halvorsen
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.