LDA konu model algoritmasında bu varsayımı gördüm. Ama neden Dirichlet dağılımını seçtiğimi bilmiyorum? Multinomial üzerinden Uniform dağılımını çift olarak kullanabilir miyiz?
LDA konu model algoritmasında bu varsayımı gördüm. Ama neden Dirichlet dağılımını seçtiğimi bilmiyorum? Multinomial üzerinden Uniform dağılımını çift olarak kullanabilir miyiz?
Yanıtlar:
Dirichlet dağılımı a, önceden konjuge çokterimli dağıtımı için. Bunun anlamı, eğer multinomiyal parametrelerin önceden dağılımı Dirichlet ise, o zaman posterior dağılımı da bir Dirichlet dağılımıdır (öncekilerden farklı parametrelerle). Bunun yararı (a) posterior dağılımın hesaplanması kolaydır ve (b) bir şekilde veri toplandıktan sonra inançlarımızın ne kadar değiştiğini ölçmek mümkündür.
Belirli bir önceliği seçmek için bunların iyi nedenler olup olmadığı tartışılabilir, çünkü bu kriterler gerçek önceki inançlarla ilişkili değildir ... Bununla birlikte, eşlenik öncüller, yukarıda belirtilen sebeplerle genellikle makul derecede esnek ve uygun olduklarından popülerdirler. .
Multinom dağılımının özel durumu için, multinom parametrelerinin (yani farklı kategoriler için olasılıklar vektörü olsun. Eğer veri toplama öncesinde, daha sonra, belirli bir gözlem farklı kategoride, ( p 1 , … , p k ) ∼ Dirichlet ( α 1 , … , α k ) ( x 1 , … , x k ) ( p 1 , … , p k ) | ( x 1 , … , x k ) ∼ Dirichlet (
Tekdüze dağılım aslında Dirichlet dağılımının özel bir durumudur; durumuna karşılık gelir . Bu yüzden en küçük bilgilendirici önce Jeffreys için . Dirichlet sınıfının bu doğal "bilgilendirici olmayan" öncelikleri içermesi gerçeği, onu kullanmak için başka bir nedendir.
Ayrıca Måns T 'ın cevabına aykırı olmak yerine , Bayesian modellemede “öncek” diye bir şeyin olmadığını işaret ediyorum! Dirichlet dağılımı (a) eşleniklik, (b) hesaplama ve (c) parametrik olmayan istatistiklerle bağlantı (çünkü Dirichlet işleminin ayrıklaştırılmış versiyonu olduğundan) nedeniyle uygun bir seçimdir.
Bununla birlikte, (i) multinomun ağırlığına ne koyduğunuz ne olursa olsun, öznel Bayes seviyesindeki meşru bir cevaptır ve (ii) önceden bilgi olması durumunda Dirichlet dağılımına basitleştirilmesi için hiçbir neden yoktur. Ayrıca, Dirichlet dağılımlarının karışımları ve konvolüsyonlarının öncelikli olarak kullanılabileceğini unutmayın.