Bunların çoğu arka plan, Dirichlet işlem karışımları hakkında yeterince bilginiz varsa sonuna kadar atlayın . Diyelim ki bazı verileri Dirichlet işlemlerinin bir karışımından geliyormuş gibi modelleniyorum, yaniF∼D(αH) ve şartlı F üstlenmek
Yi∼iid∫f(y|θ)F(dθ).
Burada ve önceki temel ölçüttür. Her gözlem için , ilişkili latent biliyorsanız, bu modeldeki olasılığının burada farklı değerlerinin sayısıdır (rastgele ölçü neredeyse kesin olarak ayrıktır). Escobar ve West , bir Gamma kullanarak örneklemesi için aşağıdaki şemayı geliştirdiler ; ilk olarak, yazarlarα>0αHYiθiα
L(α|t)∝αtΓ(α)Γ(α+n)
tθbenFαπ( α | t ) ∝ π( α )αtΓ ( α )Γ ( α + n )∝ π( α )αt - 1( α + n ) B ( α + 1 , n )= π( α )αt - 1( α + n )∫10xα( 1 - x)n - 1 dx ,
burada beta işlevidir. Daha sonra, gizli bir parametresi , olasılıkın Gamma dağılımlarının bir karışımı biçiminde olduğunu ve bunu bir Gibbs örnekleyicisini yazmak için kullandığını unutmayın.
B ( ⋅ , ⋅ )X∼Beta(α+1,n)
Şimdi sorum. Neden sadece
ve Gama dağıtımlarının bir karışımını kullanmak yerine tek bir Gama dağıtımı mı kullanıyorsunuz? Biz tanıtmak Eğer Ben aynı şeyi yapmak mümkün ama karışımını kullanmaya gerek kalmadan gerekmez mi?
L(α|t)∝αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)∝αt∫10xα−1(1−x)n−1 dx,
X~Beta(α,n)
Daha fazla ayrıntı için düzenleyin Daha Fazla Ayrıntı: Bazı boşlukları doldurmak için Escobar ve Batı'daki argüman, şekil ve ortalama , ile bir Gamma dağılımına izin ve böylece tanıtabiliriz gizli bir böyleceKoşulların tamamı için bir dağılımı ve bir ve birαabir /b
π( α | t )∝αa + t -2( α + n)e- b α∫10xα( 1 -x)n - 1 dx
Xπ( α , x | t ) ∝αa + t - 2( α + n )e- b αxα( 1 - x)n - 1.
Beta (α+1,n)XG,( a + t , b -log( x ) )G,( a + t - 1 , b -log( x ) ) için .
α
Aynı bağımsız değişken ile, aynı sonucu var fakat için ve için . Bu benim için daha kolay görünüyor; neden bunu yapmıyorlar?Beta (α,n)XG,( a + t , b - günlük( x ) )α