İki değişkenli binom dağılımını görselleştirin


11

Soru: İki boyutlu binom dağılımı 3 boyutlu uzayda neye benziyor?

Aşağıda, parametrelerin çeşitli değerleri için görselleştirmek istediğim belirli bir işlev bulunmaktadır; yani , ve .p 1 p 2np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

İki kısıtlama olduğuna dikkat edin; ve . Ayrıca , pozitif bir tamsayıdır, örneğin .p 1 + p 2 = 1 n 5x1+x2=np1+p2=1n5

LaTeX (TikZ / PGFPLOTS) kullanarak fonksiyonu çizmek için iki girişimde bulunmuşlardır. Bunu yaparken, aşağıdaki değerler için aşağıdaki grafikleri elde ederim: , ve ve , ve . Alan değerleri üzerindeki kısıtlamayı uygulamada başarılı olamadım; , bu yüzden biraz güldüm.p 1 = 0,1 p 2 = 0,9 n = 5 p 1 = 0,4 p 2 = 0,6 x 1n=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

Herhangi bir dilde üretilen bir görselleştirme iyi olur (R, MATLAB, vb.), Ancak LaTeX'te TikZ / PGFPLOTS ile çalışıyorum.

İlk girişim

n=5 , vep1=0.1p2=0.9

resim açıklamasını buraya girin

İkinci deneme

n=5 , vep 2 = 0,6p1=0.4p2=0.6

resim açıklamasını buraya girin

Düzenle:

Referans olarak, burada bir grafik ihtiva eden bir eşyadır. Makalenin başlığı Atanu Biswasa ve Jing-Shiang Hwang'ın "Yeni bir iki değişkenli binom dağılımı" dır. İstatistik ve Olasılık Mektupları 60 (2002) 231-240.

Düzenleme 2: Açıklık sağlamak için ve yorumlarda @GlenB'e yanıt olarak, dağıtımın bana kitabımda nasıl sunulduğunun bir anlık görüntüsü. Kitap dejenere / dejenere olmayan vakaları ve benzerlerini ifade etmemektedir. Basitçe böyle sunar ve görselleştirmeye çalıştım. Şerefe! Ayrıca, @JohnK tarafından belirtildiği gibi, x1 + x1 = 1 ile ilgili bir yazım hatası olması muhtemeldir, bu da x1 + x1 = n olmasını önerir.

resim açıklamasını buraya girin

Denklemin görüntüsü:

Spanos, A (1986) Ekonometrik modellemenin istatistiksel temelleri. Cambridge Üniversitesi Yayınları


5
Ama sürekli olmamalı, değil mi? Her iki rastgele değişken de ayrıktır.
JohnK

1
Yani x1 ve x2 bağımsızdır, doğru mu? Sahte bir 3D plana mı ihtiyacınız var? Bir ısı haritası kabul edilebilir mi?
gung - Monica'yı eski

1
bir şey böyle ?
Antoni Parellada

2
@JohnK Eğer ve p 1 + p 2 = 1 Seninleyiz uğraşan X 1 ~ Binom ( n , p 1 ) (ve X 2 basitçe n - X 1 ). Bu tek değişkenli binomdur (veya iki değişkenli olarak kabul edilir, dejenere olur ). x1+x2=np1+p2=1X1~iki terimli(n,p1)X2n-X1
Glen_b

3
Sorunuzda iki değişkenli bir binom belirtiminiz yok. (Muhtemelen "binom" olarak adlandırılabilecek iki değişkenli bir dağıtım belirtmenin birden fazla yolu vardır. Bunlardan herhangi birine sahip değilsiniz, ancak dejenere olanınız bazılarının özel bir örneği olacaktır.) ... Biswasa ve Hwang referansınız ayrı bir iki değişkenli pmf'nin uygun göstergeleri değildir . Kısacası, sorunuzda çizilecek bir şey yok ve referansınız esas olarak neyin önleneceğine bir örnek olarak yararlıdır.
Glen_b-Monica

Yanıtlar:


8

Bunun iki parçası vardır: önce bireysel olasılıkların ne olduğunu bulmanız gerekir, o zaman bunları bir şekilde çizmeniz gerekir.

Bir binom PMF, bir dizi 'başarı' üzerinde sadece bir olasılıklar kümesidir. İki değişkenli bir binom PMF, olası 'başarıların' kombinasyonlarının bir ızgarası üzerinde bir dizi olasılık olacaktır. Sizin durumunuzda , bu yüzden ( 0 başarının bir olasılık olduğunu unutmayın ) ızgara / iki değişkenli binom dağılımında 6 × 6 = 36 olası sonuç vardır. ni=nj=506x6=36

İlk önce marjinal binom PMF'lerini hesaplayabiliriz, çünkü bu çok basittir. Değişkenler bağımsız olduğundan, her bir ortak olasılık sadece marjinal olasılıkların ürünü olacaktır; bu matris cebiridir. Burada Rkod kullanarak bu işlemi göstermek :

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

Bu noktada, iki zorunlu olasılık matrisine sahibiz. Onları nasıl çizmek istediğimize karar vermeliyiz. Dürüst olmak gerekirse, 3D çubuk grafiklerin büyük bir hayranı değilim. Çünkü Rbenimle aynı fikirde gibi görünüyor, Excel'de bu araziler yaptı:

b19:

resim açıklamasını buraya girin

b46:

resim açıklamasını buraya girin


Sunum artı R kodu için teşekkür ederiz. Bu bana x1 + x2 = n hakkında soru sormamı sağlıyor. Bu durum geçerliyse, burada gösterildiği gibi yalnızca tek bir sütun satırı olmalıdır: reference.wolfram.com/language/ref/MultinomialDistribution.html Sanırım wolfram grafiği @Glen_b'in dejenere vaka olarak adlandırdığı şeydir? Bu dejenere olmayan davayı sunduğunuz anlamına mı geliyor?
Graeme Walsh

1
GraemeWalsh, sunumum x1 + x2 = n olan iki değişkenli bir binom göstermiyor. @Glen_b yorumlarda ve onun cevabında yoğun bir şekilde tartıştığı gibi, gerçekten bunu nitelendirmeden bir "iki değişkenli binom dağılımı" olarak adlandırmayacağım. Ayrıca, yanıt yorumunuzda söylediğiniz gibi x1 ve x2'nin bağımsız olmadığı, ancak tamamen bağımlı olduğu anlamına gelir. Aslında, bunun çok tuhaf bir varyant olduğunu fark etmedim (yeterince yakından okumadığım için beni suçlayabilirsin). Glen_b'in gösterdiği gibi, bu versiyon tek bir sütun dizisi olacaktı. Sunulan dejenere olmamış durumdu.
gung - Monica'yı eski

@gung Yeni konularını beğendim. Bence sizin tartışmanız yozlaşmış davayı gayet iyi kapsıyor ("bireysel olasılıkların ne olduğunu bulmanız gerekiyor" gerçekten her şeyi söylüyor; dejenere vaka için gerçek hesaplamalar önemsizdir); Bu önemsiz hesaplamaları yaptım.
Glen_b

7

gung'un cevabı, sorunları çok iyi açıklayan gerçek bir iki değişkenli binom için iyi bir cevaptır (bunu büyük olasılıkla başkaları için yararlı olacak başlık sorusuna iyi bir cevap olarak kabul etmenizi tavsiye ederim).

x1n

Öyleyse işleri düzgün tanımlayalım. Rastgele değişkenin hiçbir tanımının aslında sunulmadığına dikkat edin, bu yüzden bazı tahminler bırakıyoruz.

Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

P(X1=x1)x2=n-x1p2=1-p1

n=6,p1=0.3

resim açıklamasını buraya girin

x2x11-x1x2

Bunu (ölçekli) dejenere iki değişkenli bir binom olarak kabul edebiliriz:

resim açıklamasını buraya girin

ancak kitapta tanımlanan şeyi gerçekten iki değişkenli bir binom olarak adlandırmak biraz zor (çünkü etkili bir şekilde tek değişkenli bir binom).

Birinin 3D'ye benzer bir komplo oluşturmak isteyeceği varsayımına göre, bu (R) kodunun biraz fazlası yukarıdaki ikinci taslağa oldukça yakın olur:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

( scatterplot3dAynı adın işlevini içeren pakete ihtiyacınız var .)

"Gerçek" (dejenere olmayan) iki değişkenli bir binomiyal bir anda her iki değişkente de değişiklik gösterir. Burada belirli bir tür iki değişkenli binom örneği (bu durumda bağımsız değildir). Ben arsa farklı renkler kullanmaya başvurdu çünkü aksi takdirde "sopa" ormanda kaybolmak çok kolay.

resim açıklamasını buraya girin

X~çöp Kutusu(n0,p)Y~çöp Kutusu(ny,p)Z~çöp Kutusu(nz,p)X1=X+YX2=X+Z

X1X2

n0nynz=Xx1=x2x1+x2=n

[1]: Hamdan, MA (1972),
"İki Değişkenli Binom Dağılımının Eşitsiz Marjinal Endekslerle Kanonik Genişlemesi"
International Statistical Review , 40 : 3 (Ara.), S. 277-280


corr(X1,X2)=1

Glen_b. Çok teşekkür ederim. Sunulan matematik nesnesinin (bana sunuldu!) Bir (ölçekli) dejenere iki değişkenli binom olduğuna işaret etmek çok yardımcı oldu! Bunu en başından beri bilmiyordum. Son olarak, temel bir istek! Gerçek veya gerçek iki değişkenli bir binomu nasıl tanımladığınız konusunda açık (matematik gösterimi yoluyla) olmanız mümkün müdür? Bunun yararlı olacağını düşünüyorum.
Graeme Walsh

1
X~çöp Kutusu(n0,p)Y~çöp Kutusu(ny,p)Z~çöp Kutusu(nz,p)X1=X+YX2=X+Z

1
X1X2

@Graeme ... Daha fazla ayrıntı eklemeyi planlıyorum.
Glen_b

4

Mathematicaartık bu tür şeylerde oldukça güçlü - probleminizin çözümünü doğrudan dokümantasyonda sunuyor . Küçük eklemelerle etrafta oynamak için bir model yaptım ( p = p1 = 0.4daha iyi görsel sunum için). Arayüz böyle görünüyor ve nasıl kontrol edilebiliyor.

resim açıklamasını buraya girin

Pasaj

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Buradaki en önemli şey PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], ki bu kendini açıklayıcı. Multinomialsadece piilgili değişken için her biri ile çok sayıda dağıtım alabileceğiniz anlamına gelir . Basit form BinomialDistribution. Tabii ki, manuel olarak yapabilirim, ancak kural bir yerleşik işleve sahipseniz - onu kullanmalısınız.

Kod yapısı hakkında bazı yorumlara ihtiyacınız varsa, lütfen bana bildirin.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.