Prediktif çıkarım için hangi Bayesian dışı yöntemler var?


22

Bayesci çıkarımda, gelecekteki veriler için bir tahmin edici dağılım bilinmeyen parametrelerin bütünleştirilmesiyle elde edilir; Bu parametrelerin posterior dağılımına entegrasyon posterior tahminsel dağılım verir - daha önce gözlemlenmiş olanlara bağlı gelecekteki veriler için bir dağılım. Parametre tahminlerindeki belirsizliği hesaba katan, öngörülen çıkarsama için hangi Bayesian olmayan yöntemler var (yani, sadece maksimum olasılık tahminlerini veya yoğunluk fonksiyonuna geri dönüşü olmayan).

Herkes lineer bir regresyondan sonra tahmin aralıklarını nasıl hesaplayacağını bilir, fakat hesaplamaların arkasındaki prensipler nelerdir ve diğer durumlarda nasıl uygulanabilir (örneğin, veri parametresindeki oran parametresini tahmin ettikten sonra yeni bir üstel değişken için kesin bir tahmin aralığı hesaplama)?


6
Bunun harika bir soru olduğunu düşünüyorum ve en azından kısmi bir cevap vermek istiyorum, ancak bir süredir adaleti yapmak için zaman kazanamadım ... bu yüzden şimdilik bunun üzerine bir ödül alıyorum .
Glen_b -Reinstate Monica

3
@ DavidC.Norris Neden bunun bunun ötesinde başka herhangi bir parametre belirsizliği kaynağı olduğu konusunda ısrar etmesi gerektiğini anlamıyorum (bu nedenle, tahmin edici çıkarımın hem bunun hem de sürecin kendisindeki rastgele değişkenliği hesaba katması gerekir). Oldukça basit örneklerde bile kendisinin önemi yok - örneğin bir Poisson veya negatif binom regresyonundan elde edilen tahminlerin toplamı için tahmin aralıkları üretmeye çalışın. Birinin, kategoriler arasında parametrelerde farklılıklar olduğunu varsaymak için bir Bayesian olması gerekmez (insanlar için karma modeller kullanmışlar gibi).
Glen_b -Reinstate Monica

2
@ DavidC.Norris: Ben Bayesian'e ait olmayan yöntemlerden bahsettim, çünkü Bayesian istatistiklerine her girişte posterior öngörücü dağılımların hesaplanması yapılmaktaydı, oysa tahmin aralıklarını hesaplamak için genel sık kullanılan yöntemler yaygın olarak bilinmemektedir.
Scortchi - Eski Monica

2
@EngrStudent, bootstrapping, orijinal verileri yeniden örnekleyerek çalışır ve bu nedenle sadece belirsizlik kaynağı olarak örnekleme varyasyonuyla ilgilenen diğer sık ​​kullanılan yöntemlerle aynı kategoriye girer. Belirsizlik kavramını kendisi genişletmez.
David C. Norris,

3
@ DavidC.Norris: edilir - Gelecek gözlemler ziyade parametreleri hakkında çıkarsama tahminler etkileyen olarak - bir belirsizlik kaynağı olarak varyasyonu örnekleme ben olmayan Bayes yöntemleri belirsizlik hesabı başka türlü içine almaya ziyade, burada ilgilidir ediyorum.
Scortchi - Monica'yı yeniden kurun

Yanıtlar:


20

Bayesian dışı öngörücü çıkarım (SLR vakası dışında) nispeten yeni bir alandır. "Bayesian olmayan" başlığı altında, yaklaşımları "klasik" frekansçılara karşı "olasılık" temelli olanlara bölebiliriz.

Klasik Frekanscı Tahmin

αβ

Şimdi, genellikle genel PI'lerin çoğu istatistik kursunda sunulması ve öğretilmesiyle ilgili sorunlar yaşadım, çünkü ezici eğilim, bunları kesinlikle Bayesian arka öngörücü aralıkları olarak yorumlamaktır, ki bunlar kesinlikle değil. En temelde, farklı olasılıklardan bahsediyorlar! Bayesian, miktarlarının tekrarlanan örnekleme performansları hakkında hiçbir iddiada bulunmaz (aksi halde sık görüşme yaparlar). İkincisi, bir Bayesian PI aslında Klasik Bir Öngörü Aralığı'ndan daha Klasik Bir Tolerans Aralığı ile ruhani açıdan benzer bir şeyi gerçekleştiriyor.

Referans için: Tolerans Aralıklarının iki olasılık tarafından belirtilmesi gerekir : Güven ve kapsam. Güven, tekrarlanan örneklerde ne kadar doğru olduğunu gösterir. Kapsam, bize gerçek dağılımın altındaki aralığın minimum olasılık ölçüsünü bildirir (PI'nın aksine, tekrarlanan örneklemede tekrar beklenen olasılık ölçüsünü verir ). Temel olarak, Bayesian PI'nin de yapmaya çalıştığı şey, fakat tekrarlanan örnekleme talepleri olmadan.

Dolayısıyla, İstatistik 101 Basit Doğrusal Regresyonun temel mantığı, PI'nin tekrarlanan örnekleme özelliklerini normallik varsayımı altında türetmektir. Tipik olarak “klasik” olarak düşünülen ve intro istatistik sınıflarında öğretilen sık + Gauss yaklaşımı. Bu, sonuçta elde edilen hesaplamaların basitliğine dayanmaktadır ( hoş bir genel bakış için Wikipedia'ya bakınız ).

Gauss olmayan olasılık dağılımları genel olarak problemlidir, çünkü bir aralık elde etmek için özenle ters çevrilebilecek çok önemli miktarları içeremezler. Bu nedenle, bu dağılımlar için "kesin" bir yöntem yoktur, çünkü genellikle aralığın özellikleri gerçek temel parametrelere dayanır.

Bu yetersizliği kabul ederek, olasılık yaklaşımıyla birlikte başka bir tahmin sınıfı (ve çıkarım ve tahmin) ortaya çıktı.

Olabilirliğe Dayalı Çıkarım

Olabilirlik temelli yaklaşımlar, pek çok modern istatistiksel kavram gibi, Ronald Fisher'a kadar uzanıyor. Bu okulun temel fikri, özel durumlar dışında, istatistiksel çıkarımlarımızın, olasılık olasılıklarını tam olarak verebileceğimiz normal bir dağılımdan (parametre tahminleri dikey olan ) çıkarımlarla uğraşmakta olduğumuzdan daha mantıklı bir zeminde olmadığıdır . Bu çıkarım görüşünde, kesin durum dışında olasılıkla ilgili ifadelerden gerçekten kaçınılmalı, aksi halde ihtimalle ilgili ifadeler yapılmalı ve birinin kesin olasılık olasılığını bilmediğini (sık sık bir anlamda) kabul etmelidir.

Bu nedenle, olabilirliği Bayesian olasılığına benzer olarak görebiliriz, ancak entegrasyon gereklilikleri ya da sık sık olasılıkla muhtemel karışıklıklar olmadan. Yorumlanması tamamen özneldir ... ancak tek bir parametre çıkarımı için genellikle 0.15 olabilirlik oranı önerilir.

Bununla birlikte, kişi açıkça “olasılık aralıkları” veren kağıtları görmemektedir. Niye ya? Olasılık temelli güven ifadelerine alıştığımız için, bunun büyük ölçüde bir sosyoloji meselesi olduğu anlaşılıyor. Bunun yerine, sıkça gördüğünüz şey, bunun “yaklaşık” veya “asimptotik” güven aralığına atıfta bulunan bir yazardır. Bu aralıklar büyük ölçüde, olasılık oranının asimptotik Ki-kare dağılımına dayandığımız olasılık olabilirlik yöntemlerinden türetilmiştir, aynı şekilde örnekleme ortalamasının asimptotik normalliğine güveniyoruz.

Bu "düzeltme" ile artık Bayesliler kadar mantıksal tutarlılığa sahip "yaklaşık"% 95 Güven Bölgelerini oluşturabiliriz.

Olabilirlik Çerçevesinde CI'dan PI'ya

Yukarıdaki olasılık yaklaşımının başarısı ve kolaylığı, öngörüyü nasıl genişleteceğine dair fikirlere yol açtı. Bununla ilgili çok güzel bir anket makalesi burada verilmektedir (mükemmel kapsamını çoğaltmayacağım). 1970'lerin sonlarında (bkz. JSTOR ) terimini oluşturan David Hinkley'e kadar izlenebilir . O çok yıllık " Pearson Binom Tahmini Sorun " olarak uyguladı . Temel mantığı özetleyeceğim.

yyy

Tahmini bir olasılık elde etmek için "sıkıntı" parametrelerinden kurtulmak için temel kurallar şunlardır:

  1. μ,σ
  2. Eğer bir parametre rastgele ise (örneğin, gözlemlenmemiş diğer veriler veya "rastgele etkiler"), o zaman onları birleştirirsiniz (tıpkı Bayesian yaklaşımında olduğu gibi).

Sabit ve rastgele bir parametre arasındaki fark, olasılık çıkarımına özgüdür, ancak Bayesian, sık ve olasılık çerçevelerinin çarpıştığı görünen karışık efekt modelleriyle bağlantısı vardır.

Umarım bu, "Bayesyen olmayan" tahmininin geniş alanı (ve bu konuda çıkarım) ile ilgili sorunuza cevap verdi. Köprüler değişebildiğinden, "Olabilirlik Durumunda: İstatistiksel Modelleme ve Olabilirliği Kullanarak Çıkarım" adlı kitap için de bir eklenti yapacağım. çıkarım ve tahmin.


Referanslar

  1. Tahmin Aralıkları: Parametrik olmayan yöntemler . Vikipedi. Erişim 9/13/2015.
  2. Bjornstad, Jan F. Tahmini Olabilirlik: Bir Gözden Geçirme. Devletçi. Sci. 5 (1990), no. 2, 242 - 254. doi: 10,1214 / sn / 1177012175. http://projecteuclid.org/euclid.ss/1177012175 .
  3. David Hinkley. Tahmini Olabilirlik . İstatistiklerin Yıllıkları Vol. 4, 7 Temmuz, 1979, s. 718-728 Yayınlayan: Matematiksel İstatistik Enstitüsü Kararlı URL: http://www.jstor.org/stable/2958920
  4. Yudi Pawitan. Her Olasılıkta: İstatistiksel Modelleme ve Olabilirlik Kullanarak Çıkarım. Oxford Üniversitesi Yayınları; 1 baskı (30 Ağustos 2001). ISBN-10: 0198507658, ISBN-13: 978-0198507659 Özellikle Bölüm 5.5-5.9, 10 ve 16.

5

"Parametre tahminlerindeki belirsizliği hesaba katan, öngörücü çıkarım için hangi Bayesian dışı yöntemler var?" Sorusuna özel olarak cevabımı ele alacağım. Cevabımı belirsizliğin anlamını genişletme konusunda organize edeceğim .

İstatistiksel analizlerin, tahminler dahil olmak üzere çeşitli talepler için destek sağladığını umuyoruz . Ancak taleplerimizden emin değiliz ve bu belirsizlik birçok kaynaktan geliyor. Frekansist istatistikler, özellikle örneklemeden kaynaklanan belirsizliğin yalnızca bir bölümünü ele almak için karakteristik olarak düzenlenmiştir . Örnekleme, tarihsel olarak sık sık istatistiklerin geliştirilmesine yönelik teşviklerin çoğunu sağlayan tarımsal alan deneylerinde ana belirsizlik kaynağı olmuş olabilir. Ancak en önemli güncel uygulamaların çoğunda, durum böyle değil. Şimdi modelin yanlış tanımlanması ve görünüşte yüzlerce (!) Türden [1] olduğu çeşitli önyargılar gibi diğer her türlü belirsizlikten endişe ediyoruz.

Sander Grönland'ın bu diğer belirsizlik kaynaklarını hesaba katmanın ne kadar önemli olduğunu belirten harika bir tartışma makalesi [2] var ve bunu başarmanın aracı olarak çoklu önyargılı analiz öngörüyor. Teoriyi tamamen doğal olan Bayes terimleriyle geliştirir. Birisi, model parametreleri konusundaki belirsizliğinin resmi, uyumlu bir muamelesini sürdürmek isterse, doğal olarak parametreler üzerindeki pozitif (öznel) olasılık dağılımlarına yönlendirilir; Bu noktada, ya Bayesian Şeytan'a kaybedilirsiniz ya da Bayesian Cennet Krallığı'na girersiniz (dine bağlı olarak).

Sorunuza, @Scortchi, bunun "Bayesian dışı yöntemlerle" yapılıp yapılamayacağı hakkında, Bayesian dışı bir geçici çözüm [3] 'te gösterildi. Ancak, Bayesianism hakkında sorunuzu yazacak kadar bilgili olan herkes için, buradaki tedavi, Bayesian hesaplamaları 'kurnazca' tabiri caizse 'uygulamaya koyma girişimi gibi görünecektir. Aslında, yazarların onayladığı gibi (bkz. Sf. 4), kitabın sonuna doğru daha ileri yöntemlere ne kadar yaklaşırsanız, yöntemler tam olarak sorunuzda tanımladığınız entegrasyona benziyor. Sonunda, Bayesianizm'den ayrıldıkları yerin, sadece tahmin etmeden önce parametrelerinde açık öncelikleri ortaya koymadıklarını öne sürüyorlar.

Bunu açıkça öngörmeyle ilişkilendirmek için , yalnızca tahmin edilen parametrelerin bir fonksiyonu olarak 'öngörmeyi' takdir etmek gerekir. [2] 'de Grönland gösterimi kullanır.θ(α)αθ

  1. Chavalarias, David ve John PA Ioannidis. “Bilim Haritalama Analizi, Biyomedikal Araştırmada 235 Önyargıyı Karakterize Ediyor.” Klinik Epidemiyoloji Dergisi 63, no. 11 (Kasım 2010): 1205-15. doi: 10.1016 / j.jclinepi.2009.12.011.

  2. Grönland, Sander. “Gözlemsel Verilerin Analizi İçin Çok Yönlü Modelleme (Tartışma ile).” Kraliyet İstatistik Kurumu Dergisi: Seri A (Toplumdaki İstatistikler) 168, no. 2 (Mart 2005): 267-306. DOI: 10.1111 / j.1467-985X.2004.00349.x.

  3. Lash, Timothy L., Matthew P. Fox ve Aliza K. Fink. Epidemiyolojik Verilere Kantitatif Önyargı Analizinin Uygulanması. Biyoloji ve Sağlık İstatistikleri. New York, NY: Springer New York, 2009. http://link.springer.com/10.1007/978-0-387-87959-8 .


2
Teşekkürler! Kulağa çok ilginç geliyor, ancak öngörülü çıkarımlarda çoklu / nicel önyargı analizinin nasıl kullanıldığına dair kısa bir taslak ekleyebilmeniz faydalı olur.
Scortchi - Monica'yı yeniden kurun

Tahmin bağlantısının açık olması için bir paragraf ekledim . Açıklama isteğiniz için teşekkür ederiz, @Scortchi.
David C. Norris,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.