Dirichlet dağılımındaki alfa tam olarak nedir?


26

Bayesian istatistiklerinde oldukça yeniyim ve algoritmasının arka ucunda Dirichlet işlemini kullanan düzeltilmiş bir korelasyon ölçüsü olan SparCC ile karşılaştım . Neler olduğunu gerçekten anlamak için adım adım algoritmaya girmeye çalışıyorum ama alphabir Dirichlet dağılımında vector parametresinin ne yaptığından ve vector parametresini nasıl normalleştirdiğinden tam olarak emin değilim alpha?

Uygulama Pythonkullanılıyor NumPy: https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.dirichlet.html

Doktorlar diyor ki:

alpha: array Dağılım parametresi (k boyutu örneği için k boyutu).

Sorularım:

  1. alphasDağılımı nasıl etkiler ?;

  2. alphasNormalleştirme nasıl yapılır ?; ve

  3. alphasTamsayı olmadığında ne olur ?

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Reproducibility
np.random.seed(0)

# Integer values for alphas
alphas = np.arange(10)
# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

# Dirichlet Distribution
dd = np.random.dirichlet(alphas) 
# array([ 0.        ,  0.0175113 ,  0.00224837,  0.1041491 ,  0.1264133 ,
#         0.06936311,  0.13086698,  0.15698674,  0.13608845,  0.25637266])

# Plot
ax = pd.Series(dd).plot()
ax.set_xlabel("alpha")
ax.set_ylabel("Dirichlet Draw")

görüntü tanımını buraya girin


6
Bu dağıtımdaki Wikipedia girdisi ile ilgili sorunlarınız mı var ?
Xi'an,

2
Özür dilerim, doğru ifade ettiğimi sanmıyorum. Olasılık dağılımının / pdf / pmf'nin ne olduğunu biliyorum ama normalleşmenin nasıl gerçekleştiği konusunda kafam karıştı. Vikipedi, normalizasyonun sonra gama fonksiyonları ile gerçekleştiği görülüyor . Dağıtımlar üzerinde bir dağıtım olarak adlandırıldığını duydum ve bunu wikipedia'daki eşlerden görmek zor. xiα1
O.rka

1
Alfaları normalleştirirseniz, dağılımın ortalamasını elde edersiniz. Dağılımı normalleştirirseniz, onun üzerindeki integralinin 1'e eşit olduğundan ve dolayısıyla geçerli bir olasılık dağılımından emin olursunuz.
Eskapp

1
Dirichlet dağılımı, simpleks üzerindeki bir dağıtımdır, bu nedenle sonlu destek dağılımları üzerine bir dağıtımdır. Sürekli dağılımlar üzerinde bir dağıtım hedefliyorsanız, Dirichlet sürecine bakmalısınız.
Xi'an

Yanıtlar:


67

Dirichlet dağılımı tanımlayan bir çok değişkenli olasılık dağılımıdır değişkenler , her şekilde, x i( 0 , 1 ) ve Σ K i = 1X 1 , , X k α = ( α 1 , , α k )k2X1,,Xkxi(0,1) ve bir vektör tarafından parametrelenmişse, pozitif değerli parametreler. Parametrelertamsayı olmakzorunda değildir, sadece pozitif gerçek sayılar olması gerekir. Herhangi bir şekilde "normalize" değiller, bu dağılımın parametreleri.i=1Nxi=1α=(α1,,αk)

Dirichlet dağılımı, beta dağılımının birden fazla boyutta genelleştirilmesidir , böylece beta dağılımı hakkında bilgi edinerek başlayabilirsiniz. Beta, ve parametreleri tarafından parametrelendirilen rasgele değişkeninin tek değişkenli bir dağılımıdır . Güzel bir sezgi, bunun bir ve olduğunu hatırlarsanız gelir.α β α β p p α = α + başarı sayısı β = β + başarısızlık sayısı α βX(0,1)αβ eşlenik önsel için binom dağılımı ve bir beta varsayarsak önce parametreli ve binom dağıtımın olasılık parametresi için , daha sonra arka dağıtım de olduğu tarafından tanımlanan beta dağılımıαβppα=α+number of successesβ=β+number of failures . Aklınıza gelebilecek Yani ve itibariyle pseudocounts başarı ve başarısızlıkları (ayrıca çek (bunlar tamsayılar olmak gerekmez) Konuyu ).αβ

Dirichlet dağılımı durumunda , multinom dağılımından önce bir konjugattır . Binom dağılımı durumunda biz urn değiştirilmesi ile beyaz ve siyah topları çizim açısından düşünmek, o zaman multinomial dağılım durumunda biz yedek ile çizim topları görünenk p 1 , , p k p 1 , , p k α 1 , , α k α 1 , , α k α 1 + n 1 , , α k + n kNk renklerinde Topların olasılıkları . Dirichlet dağılımı için bir konjüge önce olduğu olasılıkları ve olarak düşünülebilir parametreleri pseudocounts her renk topları kabul önselp1,,pkp1,,pkα1,,αk(ama aynı zamanda böyle bir akıl yürütmenin tuzaklarını da okumalısınız ). Dirichlet-multinomial model , her kategorideki gözlemlenen sayıları toplayarak güncellenir: , beta-binom modelinde olduğu gibi.α1,,αkα1+n1,,αk+nk

Daha yüksek bir değer , daha fazla "ağırlık" toplam "kütle" daha fazla miktarı, kendisine atanmış olan (toplam olması gerektiğini hatırlama ). Tüm eşitse, dağılım simetriktir. Eğer , anti-ağırlık olarak düşünülebilir uzağa iterX i x 1 + + x k = 1αiXix1++xk=1α i < 1 x i x i α 1 = = α k = 1αiαi<1xi yüksek olduğunda, çeker iken aşırı doğru, anlamda merkezi bazı merkezi değere (doğru tüm noktalar etrafında, konsantre olması değil de simetrik olarak merkezi olduğunu hissetmek). Eğer , noktalar düzgün olarak dağıtılırlar.xiα1==αk=1

Bu, aşağıdaki değişkenlerde görülebilir, burada üç değişken Dirichlet dağılımlarını görebilirsiniz (ne yazık ki, yalnızca (en fazla üç boyutta makul alanlar üretebiliriz) (a) , (b) , (c) , (d) .α 1 = α 2 = α 3 = 10 α 1 = 1 , α 2 = 10 , α 3 = 5 α 1 = α 2 = α 3 = 0.2α1=α2=α3=1α1=α2=α3=10α1=1,α2=10,α3=5α1=α2=α3=0.2

Dirichlet dağılımlarından dört farklı örnek

Dirichlet dağılımına bazen “dağılımların dağılımı” denir , çünkü olasılıkların kendileri olarak da düşünülebilir. Her ve , o zaman birinci ve ikinci olasılık aksiyomları ile tutarlı olduğuna dikkat edin . Böylece, Dirichlet dağılımını kategorik veya multinom gibi dağılımlarla tanımlanan ayrık olaylar için olasılıkların bir dağılımı olarak kullanabilirsiniz . Öyle değilk i = 1 x i = 1xi(0,1)i=1kxi=1 kxiHerhangi bir dağılımın üzerinde bir dağıtım olduğu için, örneğin sürekli rastgele değişkenlerin olasılıkları veya hatta bazı ayrı olanlar olasılıklarıyla ilgili değildir (örneğin Poisson dağıtılmış rastgele bir değişken, herhangi bir doğal sayı olan değerleri gözlemleme ihtimalini açıklar; Dirichlet olasılıkları üzerindeki dağılımı, sonsuz sayıda rastgele değişkene ihtiyacınız olacaktır ).k


2
İnanılmaz açıklama
O.rka, 9:16

14

Yasal Uyarı: Bu dağıtımla daha önce hiç çalışmadım. Bu cevap dayanmaktadır bu wikipedia makalesine ve benim yorumuma .


Dirichlet dağılımı, Beta dağılımına benzer özelliklere sahip çok değişkenli bir olasılık dağılımıdır.

PDF şu şekilde tanımlanmıştır:

{x1,,xK}1B(α)i=1Kxiαi1

ile , veK2xi(0,1)i=1Kxi=1 .

Yakından ilgili Beta dağılımına bakarsak:

{x1,x2(=1x1)}1B(α,β)x1α1x2β1

ise bu iki dağılımın aynı olduğunu görebiliriz . Öyleyse yorumumuzu ilk önce buna dayandıralım ve sonra genelleyelim .K=2K>2


Bayesian istatistiklerinde, Beta dağılımı binom parametreleri için bir konjugat olarak kullanılır (Bkz. Beta dağılımı ). Birincisi, ve (ya da Dirichlet dağılımı ve ) hakkında önceden bazı bilgiler olarak tanımlanabilir . Bazı binom deneme başarısı ve başarısızlığı varsa, dağılımı şöyledir: veαβα1α2ABα1,pos=α1+Aα2,pos=α2+B . (Bu işe yaramayacağım, çünkü muhtemelen Bayesian istatistiklerinden öğrendiğiniz ilk şeylerden biri).

Dolayısıyla, Beta dağılımı , sırasıyla Binom dağılımındaki başarı ve başarısızlık olasılığı olarak yorumlanabilecek olan ve bazı arka dağılımı temsil eder . Ve ne kadar çok veri ( ve ), bu posterior dağılım o kadar dar olacaktır.x1x2(=1x1)AB


Şimdi dağılımın için nasıl çalıştığını biliyoruz , binom yerine multinom dağılım için çalışmasını yaygınlaştırabiliriz. Bu, iki olası sonuç yerine (başarı veya başarısızlık), sonuçlarına izin vereceğimiz anlamına gelir ( ise neden Beta / Binom'a genelleştirildiğine bakın ). Bu sonuçlarının her biri, olasılıkların yaptığı gibi 1 olan bir olasılığına sahip olacaktır.K=2KK=2Kxi

αi daha sonra Beta dağıtımındaki ve için bir benzer bir rol alır.α1α2xi benzer şekilde güncellenir.

Şimdi sorularınızı cevaplamak için:

alphasDağılımı nasıl etkiler?

Dağılım, ve kısıtlamaları ile sınırlandırılmıştır . parçaları belirlemek boyutlu uzayın en kütlesini olsun. Bunu bu resimde görebilirsiniz (buraya gömmek değil, çünkü resmin sahibi değilim). kadar fazla veri varsa (bu yorumu kullanarak) değeri , bu yüzden değerinden veya sonuçların her biri için olasılıklardan daha emin olursunuz . Bu, yoğunluğun daha konsantre olacağı anlamına gelir.xi(0,1)i=1Kxi=1αiKi=1Kαixi

Nasıl alphasnormalleştiriliyor?

Dağılımın normalleşmesi (integralin 1'e eşit olduğundan emin olun) teriminden geçer :B(α)

B(α)=i=1KΓ(αi)Γ(i=1Kαi)

Yine örneğine bakarsak normalize edici faktörün aşağıdakileri kullanan Beta dağılımındaki ile aynı olduğunu görebiliriz:K=2

B(α1,α2)=Γ(α1)Γ(α2)Γ(α1+α2)

Bu uzanır

B(α)=Γ(α1)Γ(α2)Γ(αK)Γ(α1+α2++αK)

Alfa tamsayı olmadığında ne olur?

Yorum için değişmez , ancak daha önce bağladığım resimde gördüğünüz gibi , eğer ise dağılımın kütlesi aralığının kenarlarında birikir . Öte yandan , bir tam sayı ve .α i < 1 x i K K 2αi>1αi<1xiKK2


1
Bunun için teşekkürler. Açıklaman çok yardımcı oldu. Keşke ikisini de doğru olarak işaretleyebilseydim.
O.rka
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.