Sadece marjinal sayımlar göz önüne alındığında, ortak dağılımın maksimum olabilirlik tahmincisi


12

Let px,y , iki Kategorik değişkenler ortak bir dağıtım olması X,Y ile, x,y{1,...,K} . Diyelim ki bu dağılımdan n örnek alındı, ama sadece için marjinal sayımlar verildi j=1,...,K:

Sj=Σben=1nδ(Xben=l),Tj=Σben=1nδ(Yben=j),

S j , T j için verilen için maksimum olabilirlik tahmincisi nedir ? Bu biliniyor mu? Hesaplamalı olarak uygulanabilir mi? Bu probleme ML dışında başka makul yaklaşımlar var mı?px,ySj,Tj


2
Marjlar, ortak dağılım hakkında gerçekten bilgi * içermez (aslında bu, kopulaların noktasıdır). * ya da en azından neredeyse hiç - marjlar en azından bazı bilgiler içeriyor, çünkü iç mekan sayıları meydana geldikleri marjları aşamaz. Aklınızda belirli bir ortak dağıtımınız var mı? maximum-entropyEtiketi neden kullandınız ? Maksimum entropi çözümünden sonra mısınız?
Glen_b -Manica Monica

Ben kopulalara pek aşina değilim. Kategorik durum için de geçerli mi? Bu ne anlama geliyor - aynı marjlara sahip her ortak dağıtımın aynı olasılığa sahip olacağı? (Maksimum entropiyi etiketledim çünkü alakalı olabileceğini düşündüm.)
RS

Henüz belirli bir dağıtım modelimiz bile yok, bu yüzden gerçekten hesaplayabilecek bir konumda değiliz . Burada çok sayıda olasılık var. Copulas, sıralı kategorik vaka için (benzersiz değilse) mevcuttur, ancak bunu yükseltme amacım, marjinallerin neden genel olarak çok bilgilendirici olmadıkları için bir motivasyon sağlamaktı. Kategorik sayım davasıyla ilgili olarak, Fisher marjları eklem hakkında bilgi vermedi, Fisher-Irwin kesin testi. Maksimum entropi istiyorsanız, muhtemelen maksimum entropi çözümü alabilirsiniz, ancak bunun hakkında çok bilgilendirici olacağını bilmiyorum ...P(x|θ)
Glen_b -Restate Monica

(ctd) ... yapısı. ME veya ML vakalarında, bivariat multinomial, bivariate hipergeometrik veya daha fazla yapıya sahip bir şey olsun, önce bir çeşit modele ihtiyacınız olacağını düşünüyorum. Yazarın bir cevaba referans verdiği bu soruya bakın . Bu yardımcı olabilir.
Glen_b

1
Genel iki değişkenli çok terimli bir dağıtım demek istedim. Soru, dağılım toplamlarının verildiği durumdan bahsediyor ve ortak dağıtımdan örnekler görüyoruz. Burada örnek toplamları var. Bence sorun ML davasında iyi tanımlanmış (çözüm benzersiz olmayabilir ama bilmiyorum).
RS

Yanıtlar:


4

Bu tür bir problem Dobra ve ark. (2006) tarafından "Sabit Marjinal Toplamlarla Çok Yönlü Acil Durum Tablolarında Veri Büyütme" makalesinde incelenmiştir . Let , modelin parametrelerinin göstermek izin n her biri için sayımların gözlemlenmeyen tamsayı tablosunu belirtmek ( x , y ) çifti ve izin θn(x,y) marjinal sayısı eşit bir tamsayı tabloları grubu olduğu ( S , T ) . Daha sonra marjinal sayıları ( S , T ) gözlemleme olasılığı: p (C(S,T)(S,T)(S,T) ; burada p ( n | θ ) çok terimli örnekleme dağılımıdır. Bu ML için olasılık fonksiyonunu tanımlar, ancak küçük problemler dışında doğrudan değerlendirme yapılamaz. Önerdikleri yaklaşım, n ve θ öğelerini dönüşümlü olarak güncellediğiniz MCMC'dir.

p(S,T|θ)=ΣnC(S,T)p(n|θ)
p(n|θ)nθbir teklif dağılımından örnek alarak ve Metropolis-Hastings kabul oranına göre değişikliği kabul ederek. Bu, Monte Carlo EM kullanılarak yaklaşık maksimum fazla bulmak için uyarlanabilir . θ

Farklı bir yaklaşım toplamı tahmin etmek için varyasyonel yöntemler kullanır . Marjinal kısıtlamalar bir faktör grafiği olarak kodlanabilir ve aşırı ference çıkarım Beklenti Yayılımı kullanılarak gerçekleştirilebilir.nθ

Bu sorunun neden zor olduğunu ve önemsiz bir çözümü kabul etmediğini görmek için durumunu düşünün . S almaS=(1,2),T=(2,1)S satır toplamlar gibi kolon toplamı olarak, sayımların iki olası tablolar şunlardır: [ 0 1 2 0 ]T Bu nedenle, olabilirlik fonksiyonu p(S,T | İçeride ISTV melerin RWMAIWi'nin)=3 p 12 p 2 21 +6 s 11 s 21 s 22 , bu sorun, The MLE olan p x , y

[0120][1011]
p(S,T|θ)=3p12p212+6p11p21p22
p^x,y=[01/32/30]
soldaki tablonun varsayılmasına karşılık gelir. Buna karşın, bağımsız olduğu varsayılarak alacağı tahmindir bu daha düşük bir olasılık değerine sahiptir.
qx,y=[1/32/3][2/31/3]=[2/91/94/92/9]

Analitik bir çözüm elde etmek mümkün değil mi?
Ben Kuhn

Teşekkürler! Kağıt, Bayes perspektifinden gelmesine rağmen, alakalı görünüyor. Belirli bir durum ne aslında dağıtım kendisi, yani θ = { θ x , y } , tüm ( x , y ) çiftleri? Bu durumda analitik bir çözüm olacağından şüphelenir misiniz? θθ={θx,y}(x,y)
RS

Analitik bir çözüm olduğundan şüphelenmem. Bunu göstermek için bir örnek ekledim.
Tom Minka

Teşekkürler. Belki de asimptotik olarak doğrudur? Daha sonra, marj toplamları üzerinde koşullandırma, marj dağılımları üzerinde koşullandırma (normalleştirmeden sonra) ile aynıdır ve gözlemlenmeyen her tamsayı tablosu için log-olasılık entropisi ile orantılıdır. Belki de AEP ile ilgili birţey?
RS

1

@ Glen_b tarafından işaret edildiği gibi, bu yetersiz bir şekilde belirtilmiştir. Olasılığı tam olarak belirleyemezseniz, maksimum olasılığı kullanabileceğinizi düşünmüyorum.

Bağımsızlığı üstlenmeye istekli olsaydınız, sorun oldukça basittir (tesadüfen, çözümün önerilen maksimum entropi çözümü olacağını düşünüyorum). Sorununuza ek yapı dayatmak istemiyorsanız veya yine de hücrelerin değerlerine bir çeşit yaklaşım istiyorsanız, Fréchet-Hoeffding kopula sınırlarını kullanabilirsiniz . Ek varsayımlar olmadan, daha fazla ilerleyebileceğinizi düşünmüyorum.


Bunun olasılığı çok terimli olabilir. Bu neden yetersiz?
RS

Anladığım kadarıyla, olasılık veriye verilen parametrelerin bir fonksiyonudur. Burada, her hücre için değerleriniz yok, sadece marjinaller var, bu nedenle hesaplayabileceğiniz parametrelerin tek bir işlevine sahip değilsiniz. Genel olarak, kenar boşluklarıyla uyumlu birçok hücre konfigürasyonu vardır ve her biri farklı bir olasılık verir.
F.Tusell

1
pp

1

px,ypx=Σypx,ypy=Σxpx,y

Yanlış şeyler şöyle:

px,yX,YS1=S2=T1=T2=10

p=(120012),p=(14141414)

pxpy ve bu nedenle eşit olasılıklara sahiptirler (her ikisi de doğrulayabileceğiniz gibi olasılık işlevini en üst düzeye çıkarır).


p=(birbcd)0<birdp=(0b+birc+bird-bir) aynı marjinallere sahiptir ve bu nedenle aynı zamanda maksimum olabilirlik çözümüdür.


X,Y

'H(p)=-Σx,ypx,ygünlükpx,yΣxpx,y=pyΣypx,y=pxg(p)=0gx(p)=Σypx,y-pxgy(p)=Σxpx,y-py

'H(p)=ΣkXYλkgk(p)

Her tüm gradyanlarıgk 1'dir, bu nedenle koordinat açısından

1-günlükpx,y=λx+λypx,y=e1-λx-λy

Σxpx,y=pyΣypx,y=pxe1/2-λx=pxe1/2-λy=py

px,y=pxpy.

S1=S2=T1=T2=10p[[10,0],[0,10]]2-20pΣ0bir10Pr[[bir,10-bir],[10-bir,bir]]104-20

Olasılıkları yanlış hesapladınız; örneğin, binom katsayılarını eklemeyi unuttunuz. Fakat iki matrisin , marjinal sayıların aynı marjinal dağılımını vermelerine rağmen, farklı marjinal sayıların ortak dağılımlarını vermesi konusunda haklısınız . (Evet!) Bunu daha çok düşüneceğim.
Ben Kuhn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.