Konsantrasyon parametreleri üzerinde hiperprior dağılımlı multinomial-Dirichlet modeli


10

Elimdeki sorunu olabildiğince genel olarak anlatmaya çalışacağım. Gözlemleri bir parametre olasılık vektör tetası ile kategorik dağılım olarak modelleniyorum .

Sonra parametre vektör teta parametreleri ile bir Dirichlet önceki dağıtımını .α1,α2,,αk

Bu durumda parametreleri üzerine hiperprior dağılımı da uygulamak mümkün ? Kategorik ve dirichlet dağılımları gibi çok değişkenli bir dağıtım mı olacak? Bana göre alfalar her zaman pozitiftir, bu yüzden bir gamma hiper prior çalışmalıdır.α1,α2,,αk

Herkes böyle (muhtemelen) overparametrized modelleri uydurma denedi emin değilim ama alfa sabit olmamalı, daha ziyade bir gama dağıtım gelmesi gerektiğini düşünmek bana makul görünüyor.

Lütfen bana bu tür bir yaklaşımı pratikte nasıl deneyebileceğime dair bazı referanslar, öngörüler sağlamaya çalışın.


Evet, bu mümkün ve yapıldı. Genel olarak buna Bayes hiyerarşik modeli denir. Tercihen, bu önceki olası bağımlılıkları hesaba katmalıdır.

@Prastrastinator teşekkürler. bu tür modellerle ilgilenen iyi Bayes hiyerarşik modelleri için referansınız var mı? Teşekkürler.
Dnaiel

@Prorastinator: Bayes Hiyerarşik Modelleriyle ilgili herhangi bir makale / rapor veya ideal olarak uygulamalı başvuru belgesi almayı başardınız mı?
Zhubarb

Yanıtlar:


12

Bunun "aşırı gelişmiş" bir model olduğunu düşünmüyorum. Dirichlet parametrelerine bir öncelik koyarak, belirli bir sonuç hakkında daha az taahhüt sahibi olduğunuzu iddia ediyorum. Özellikle, olarak muhtemelen simetrik Dirichlet dağılımlar için, bilmek (yani ) ayarını α < 1 iken, seyrek multinomial dağılımları daha önce olasılığını verir α > 1 multinomial pürüzsüz daha önce olasılığını verir dağılımları.α1=α2=...αKα<1α>1

Bir kimsenin seyrek veya yoğun multinom dağılımları için güçlü bir beklentisi olmadığı durumlarda, Dirichlet dağılımınıza bir hiper prior yerleştirmek, modelinize aralarında seçim yapmak için ek esneklik sağlar.

Başlangıçta bunu bu makaleden yapma fikrimi aldım . Kullandıkları aşırı değer önerdiğinizden biraz farklıdır. Bir dirichlet'ten bir olasılık vektörünü örnekliyorlar ve daha sonra üstel (veya gama) bir çekimle ölçeklendiriyorlar. Yani model

βDirichlet(1)λExponential()θDirichlet(βλ)

Ekstra Dirichlet, simetri empoze etmekten kaçınmak içindir.

Ayrıca insanların çok yönlü emisyon dağılımları olan gizli markov modelleri bağlamında Dirichlet için sadece Gamma hiper kullandıklarını gördüm, ancak referans bulamıyorum. Ayrıca, konu modellerinde kullanılan benzer hiperlerle karşılaşmışım gibi görünüyor.


Teşekkürler harika cevap! Bir kısa takip S'im var, bu model her bir thetas için farklı değişkenliğe izin verecek mi? Parametre lambda tüm thetas arasında paylaşıldığı için bu soruyu var, bu nedenle hepsi aynı ölçekleme parametresini paylaşır, bu nedenle modelin bu tür bir esneklik sağlayacağını merak ediyordum. Buradaki sezgi / bilginiz büyük beğeni topluyor! Teşekkürler!
Dnaiel

@Dnaiel, sorunuzu yanlış anlamış olup olmadığımı söyle, ancak evet önce simetrik dirichlet ile bile, , bu dağıtımdan çekişler seyrek üretme eğiliminde θ vektörler. Seyrek olarak ifade etmek gerekirse, θ vektörünü histogram olarak çizseydiniz, düz olmak yerine çok peaky olurdu. Yukarıdaki modelde, Dirichlet parametrelerini β parametresi bir dirichlet hiperpiorundan çektiği için simetrik değildir . Dirichlet(0.2,0.2,0.2,0.2)θθβ
jerad

4

Bu hiperprior soruna bir çözüm göstermek için PyMC3'te hiyerarşik bir gama-Dirichlet-multinom modeli geliştirdim. Dirichlet'ten önceki gamma, Ted Dunning'in blog gönderisine göre belirlenir ve örneklenir .

Uyguladığım model bu Gist'te bulunabilir, ancak aşağıda da açıklanmıştır:

Bu film derecelendirmeleri için bir Bayes hiyerarşik (havuzlama) modelidir. Her film sıfırdan beşe kadar bir ölçekte derecelendirilebilir. Her film birkaç kez derecelendirilir. Her film için derecelendirmelerin düzgün bir dağılımını bulmak istiyoruz.

Verilerden film derecelendirmeleri üzerinde üst düzey bir önceki dağılım (hiperprior) öğreneceğiz. Daha sonra her filmin kendi önceliği olacaktır, bu daha önce bu üst seviye tarafından düzeltilir. Bunu düşünmenin bir başka yolu, her film için derecelendirmelerden önce grup düzeyinde veya havuzda dağıtılacak şekilde küçülecek olmasıdır.

Bir filmin atipik bir derecelendirme dağılımı varsa, bu yaklaşım derecelendirmeleri beklenenden daha uyumlu bir şeye çekecektir. Ayrıca, daha önce öğrenilenler, çok sayıda derecelendirmeye sahip filmlerle anlamlı bir şekilde karşılaştırılmalarına izin vermek için az sayıda derecelendirmeye sahip filmleri önyüklemek için yararlı olabilir.

Model aşağıdaki gibidir:

γk=1...KGamma(α,β)

θm=1...MDirichletM(cγ1,...,cγK)

zm=1...M,n=1...NmCategoricalM(θm)

nerede:

  • KK=6
  • M
  • Nmm
  • α=1/K
  • β
  • c
  • γkk
  • θmK
  • zmnnm

1

Bu doğrudan bir Bayesci eşlenik önceki modelleme. Beta-Binom modelinden doğal bir uzatma. Bunun için iyi bir kaynak kitaptan olabilir . Posterior da Dirichlet'tir ve bu nedenle dirichlet'ten simüle edilmesi gereken özetleri verecektir.


1
Teşekkürler. Böyle bir kitaba aşinayım, harika referans. Buna bakmaya çalıştım, ancak doğrudan bu tür çok uluslu hiyerarşik modeli sağlamıyorlar, ancak uygulanabilecek tonlarca iyi fikirleri var.
Dnaiel

1
Dirichlet-multinomial bir konjugat modeldir, ancak op Dirichlet'in parametrelerinden önce bir (hiper-) hakkında sorgulamıştır. Dirichlet dağılımı için standart bir eşlenik yoktur, ancak üstel ailenin bir üyesi olduğu için gerçekte var olmalıdır .
jerad
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.