Multinomial (1 / n,…, 1 / n) ayrıklaştırılmış bir Dirichlet (1, .., 1) olarak tanımlanabilir mi?


24

Yani bu soru biraz dağınık, ama bunu telafi etmek için renkli grafikler ekleyeceğim! Önce Arkaplan, Sonra Soru (lar).

Arka fon

Diyelim ki kategorilerinde eşit probailitlerle boyutlu bir multinom dağılımınız var . Let normalize sayar (olması olduğunu dağılımından),:nnπ=(π1,,πn)c

(c1,,cn)Multinomial(1/n,,1/n)πi=cin

Şimdi üzerinde dağılımı üzerinde desteğine sahip -simplex ama ayrık adımlarla. Örneğin, bu dağılım aşağıdaki desteğe sahiptir (kırmızı noktalar):πnn=3

görüntü tanımını buraya girin

Benzer desteği olan bir başka dağıtım -boyutlu dağılımıdır, yani birim simpleks üzerinde homojen bir dağılımdır. Örneğin, burada 3 boyutlu bir rastgele çizimleri :Dirichlet ( 1 , , 1 ) Dirichlet ( 1 , 1 , 1 )nDirichlet(1,,1)Dirichlet(1,1,1)

görüntü tanımını buraya girin

Şimdi dağılımı o fikri vardı dan bir gelen çizer olarak dağıtım karakterize edilebilir ayrık desteğine bağlı olan . Aklımdaki takdirsizlik (ve bu iyi çalışıyor gibi görünüyor) simpleks içerisindeki her bir noktayı ele almak ve desteklediği en yakın noktaya “yuvarlamak” . 3 boyutlu tek taraflı baskı için, her bir renkli alandaki noktaların en yakın kırmızı noktaya "yuvarlanması" gereken aşağıdaki bölümü alırsınız:Multinomiyal ( 1 / n , , 1 / n ) Dirichlet ( 1 , , 1 ) π ππMultinomial(1/n,,1/n)Dirichlet(1,,1)ππ

görüntü tanımını buraya girin

Dirichlet dağılımı eşit olduğundan, her bir nokta için sonuçtaki yoğunluk / olasılık, her bir noktaya "yuvarlanan" alan / hacim ile orantılıdır. İki boyutlu ve üç boyutlu durumlar için bu olasılıklar:

görüntü tanımını buraya girin ( bu olasılıklar Monte Carlo simülasyonlarındandır )

Öyle görünüyor ki, en azından 2 ve 3 boyut için, in bu şekilde dağıtılması sonucu ortaya çıkan olasılık dağılımı için olasılık dağılımı ile aynı gibi görünüyor . Bu bir dağılımının normalleştirilmiş sonucudur . Ayrıca 4 boyutta denedim ve işe yarayacak gibi görünüyor.π Çok amaçlı ( 1 / n , , 1 / n )Dirichlet(1,,1)πMultinomial(1/n,,1/n)

Soru (lar)

Yani benim asıl sorum şu:

Tek tip bir Dirichlet'i bu şekilde ayrıştırırken, ile olan ilişki başka boyutlar için geçerli mi? İlişki hiç geçerli mi? (Bunu sadece Monte Carlo simülasyonu kullanarak denedim ...)Multinomial(1/n,,1/n)

Ayrıca merak ediyorum:

  • Bu ilişki devam ederse, bilinen bir sonuç mu? Ve bunun için alıntılayabileceğim bir kaynak var mı?
  • Tek tip bir Dirichlet'in bu ayrıklaştırmasının Multinomial ile bu ilişkisi yoktur. Benzer bir yapı var mı?

Bazı içerik

Bu soruyu sormamın nedeni parametrik olmayan Bootstrap ve Bayesian Bootstrap arasındaki benzerliğe bakıyorum ve sonra bu ortaya çıktı. Ayrıca yukarıdaki 3 boyutlu simpleks üzerindeki renkli alanlardaki desenin bir Voronoi diyagramı gibi göründüğünü ve olması gerektiğini de farkettim. Bunun hakkında düşünebileceğiniz bir yol (umarım) Pascal Üçgeni / Simpex'in bir dizisidir ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Renkli alanların boyutunun 2-boyutlu durumda ikinci Pascal'ın üçgeni sırasını takip ettiği yerde, 3-boyutlu durumda Pascal'ın üçüncü sıralı tetrahedronu vb. Bu multinom dağılımının bağlantısını açıklar, ama burada gerçekten derin sudayım ...


2
eğlence! (Her zamanki gibi.) Ama çorap bağlantısını özlüyorum.
Xi'an,

Ben de değiştirerek çorap çizmeye başladım. Ama sonra Bayesian Boostrap'ı düşünmeye başladım, bir şey diğerine öncülük etti ve işte burada böyle sonuçlandım :)
Rasmus Bååth

2
@ Xi'an belki de Bayesian maskotu olması gereken köpek yavrularından çok çoraplar?
Tim

Yanıtlar:


14

Bu iki dağılım her için farklıdır .n4

Gösterim

Simpleksinizi faktörü ile artıracağım , böylece kafes noktaları tamsayı koordinatlarına sahip olacak. Bu hiçbir şeyi değiştirmez, sadece gösterimi biraz daha hantal hale getirdiğini düşünüyorum.n

Let olduğu -simplex noktalar dışbükey gövde olarak verilmiştir , ..., içinde . Başka bir deyişle, bunlar tüm koordinatların negatif olmadığı ve koordinatların olarak .( n - 1 ) ( n , 0 , ... , 0 ) ( 0 , ... , 0 , N ) R, n- n-S(n1)(n,0,,0)(0,,0,n)Rnn

Let kümesini ifade örgü nokta , yani bu sayı, tüm koordinatlar yekparedir.SΛS

Eğer bir kafes noktası ise, , , herhangi bir noktadan (kesinlikle) yakın olan noktalar olarak tanımlanan Voronoi hücresini belirtmesine izin veririz .V P S P ΛPVPSPΛ

verebileceğimiz iki olasılık dağılımını koyduk . Bunlardan biri, noktasının Olasılığına sahip olduğu multinom dağılım . Diğeri Dirichlet modelini arayacağız ve her hacmine orantılı bir olasılık atar .( a 1 , . . . , Bir n ) 2 - n n ! / ( a 1 ! a n ! ) P Λ V PΛ(a1,...,an)2nn!/(a1!an!)PΛVP

Çok gayrı meşru gerekçe

Ben multinomial modeli ve Dirichlet modeli üzerinde farklı dağılımlar vermek olduğunu iddia ediyorum , her .n 4Λn4

Bunu görmek için, durumunu ve ve puanlarını göz önünde bulundurun . ve vektörün çevirisiyle uyumlu olduğunu iddia ediyorum . Bu, ve aynı hacme sahip olduğu ve böylece ve Dirichlet modelinde aynı olasılığa sahip olduğu anlamına gelir . Öte yandan, multinom modelinde farklı olasılıkları var ( Ve ) Ve dağılımların eşit olamayacağını takip eder.A = ( 2 , 2 , 0 , 0 ) B = ( 3 , 1 , 0 , 0 ) V A V B ( 1 , - 1 , 0 , 0 ) V A V B A B 2 - 44 ! / ( 2 ! 2 ! ) 2 - 4n=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,1,0,0)VAVBAB244!/(2!2!)244!/3!

Aslında ve uyumlu aşağıdaki makul ama belirgin olmayan (ve biraz belirsiz) İstem gelen aşağıda sunulmuştur:V BVAVB

Makul talep : şekli ve boyutu sadece "yakın komşuları" etkilenir , (diğer bir deyişle bu noktalar farklılık bir vektör tarafından böyle görünüyor , burada ve başka yerlerde olabilir) P Λ P ( 1 , - 1 , 0 , , 0 ) 1 - 1VPPΛP(1,1,0,,0)11

ve “acil komşularının” konfigürasyonlarının aynı olduğunu görmek ve daha sonra ve uyumlu olduğunu .B V A V BABVAVB

olması durumunda , ve ile aynı oyunu oynayabiliriz. , örneğin.A = ( 2 , 2 , n - 4 , 0 , , 0 ) B = ( 3 , 1 , n - 4 , 0 , , 0 )n5A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)

Bu iddianın tamamen açık olduğunu sanmıyorum ve biraz farklı bir strateji yerine ispat etmeyeceğim. Ancak, bunun için dağılımların neden farklı olduğuna dair daha sezgisel bir cevap olduğunu düşünüyorum .n4

Titiz kanıtı

Yukarıdaki gayrı resmi gerekçeyle olduğu gibi ve alın . Sadece ve uyumlu olduğunu kanıtlamamız gerekiyor .B V A V BABVAVB

Verilen , biz tanımlayacaktır , aşağıdaki gibi: noktaları kümesi olan , hangi . (Daha sindirilebilir bir şekilde: . , en yüksek ve en düşük arasındaki 1'den küçük olduğu noktalardır.)B P B P ( x 1 , ... , x , n ) S maksimum 1 i n ( bir I - P ı ) - dakika 1 i N ( a i - p i ) < 1 v i = aP=(p1,,pn)ΛWPWP(x1,,xn)Smax1in(aipi)min1in(aipi)<1W P v ivi=aipiWPvi

olduğunu göstereceğiz .VP=WP

Aşama 1

Hak : .VPWP

Bu oldukça kolaydır: 'in içinde olmadığını . izin verin ve ( kaybı olmadan) , . yana , daha da biliyoruz .W, P v i = x i - P ı v 1 = maksimum 1 i n v ı v 2 = dakika 1 i n v ı v 1 - v 21 n i = 1 v i = 0 v 1X=(x1,,xn)WPvi=xipiv1=max1inviv2=min1inviv1v21i=1nvi=0v1>0>v2

Şimdi . Yana ve negatif olmayan koordinatları, her ikisi de yapar , ve bu aşağıdaki çok ve . Öte yandan, . Bu durumda, en azından yakın bir şekilde olan olarak , böylece . Bu, (tamamlayıcıları alarak) .P x Q Q S S N- d i'nin s t 2 ( X , P ) - d i'nin s t 2 ( X , Q ) = v 2 1 + v 2 2 - (Q=(p1+1,p21,p3,,pn)PXQQSQΛX Q P X V P V pW Pdist2(X,P)dist2(X,Q)=v12+v22(1v1)2(1+v2)2=2+2(v1v2)0XQPXVPVpWP

Adım 2

Hak : ikili olarak ayrıktır.WP

Varsayalım. Let ve belirgin noktaları olmak ve izin . Yana ve belirgin ve her ikisi de , olması gereken bir indeks burada , ve bir yere . Genel kaybı olmadan, ve . Yeniden ve ekleyerek, .P=(p1,,pn)Λ X W PW S P S Λ i s iq i + 1 p iq i - 1 s 1q 1 + 1 p 2q 2 -Q=(q1,,qn)ΛXWPWQPQΛipiqi+1piqi1p1q1+1q 1 - p 1 + p 2 - q 22p2q21q1p1+p2q22

Şimdi ve sayılarını dikkate alın . Aslında bundan , elimizdeki . Benzer şekilde, anlamına gelir . Bunları bir araya ekleyerek, ederiz ve bir çelişki var.x1 X W P x 1 - p 1 - ( x 2 - p 2 ) < 1 X W Q x 2 - q 2 - ( x 1 - q 1 ) < 1 q 1 - p 1 + p 2 - q 2 < 2x2XWPx1p1(x2p2)<1XWQx2q2(x1q1)<1q1p1+p2q2<2

Aşama 3

Biz göstermiştir ve bu ayrÛktÛr. kapak ölçümü sıfır bir dizi kadar ve takip ettiği (ölçümü sıfır bir dizi kadar). [ ve ikisi de açık olduğundan, aslında tam olarak , ancak bu gerekli değildir.]VPWPWPVPSWP=VPWPVPWP=VP

Şimdi, neredeyse bitti. Noktaları göz önünde ve . ve birbiriyle uyumlu ve birbirlerinin tercümesi olduğunu görmek kolaydır : farklılaşabilmelerinin tek yolu, ( ve her ikisinin de yalan söylediği yüzler dışında) ' sınırını' ya veya ancak diğer değil. Fakat sınırının böyle bir kısmına ulaşmak için, veya bir koordinatını en az 1 olacak şekilde değiştirmemiz gerekir ; bu da bizi çıkarmaya garanti etmek için yeterli olacaktır.B = ( 3 , 1 , n - 4 , 0 , ... , 0 ) W, bir W B G A B B A B B G A B B A W, B S A B B A B B W birA=(2,2,n4,0,,0)B=(3,1,n4,0,,0)WAWBSABWAWBSABWAve yine de . Dolayısıyla, , ve noktalarından farklı , ve tanımları tarafından kadar , ve böylece ve uyumludur.WBSABWAWBWAWB

Daha sonra ve aynı hacme sahip olduğunu ve dolayısıyla Dirichlet modelinin multinomial modelde farklı olasılıklara sahip olmalarına rağmen, aynı olasılıkları izler .V BVAVB


Vay, titiz! Teşekkürler! Yani umduğum küçük yazışmalar kazara oldu sanırım ...
Rasmus Bååth
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.