Aynı anda yuvarlanan çeşitli çok yüzlü zarların dağılımı nedir?


15

Bir dizi Dungeons & Dragons zarından 5 Platonik katı alın. Bunlar 4 taraflı, 6 taraflı (geleneksel), 8 taraflı, 12 taraflı ve 20 taraflı zarlardan oluşur. Hepsi 1 numaradan başlar ve toplamlarına 1 yukarı doğru sayılır.

Hepsini bir kerede yuvarlayın, toplamlarını alın (minimum toplam 5, maksimum 50). Bunu birden çok kez yapın. Dağıtım nedir?

Açıkçası düşük uca doğru eğilimlidirler, çünkü daha yüksek olanlardan daha düşük sayılar vardır. Fakat bireyin ölümünde her bir kayma noktası olacak mı?

Görünüşe göre, bariz görünen şey değil. Yorumculardan birine göre, ortalama (5 + 50) /2=27.5. Bunu beklemiyordum. Hala bir grafik görmek istiyorum.] [Edit2: n zarın dağılımının her zar ile ayrı ayrı aynı olduğunu görmek daha mantıklı.


1
Yani ayrı üniforma toplamının dağılımı nedir ? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
gung - Monica'yı eski

2
Bunu incelemenin bir yolu simülasyon. , R: hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))). Aslında alçak olana doğru yönelmez; 5 ila 50 arasındaki olası değerlerin ortalaması 27.5'tir ve dağılım (görsel olarak) normalden çok uzak değildir.
David Robinson

2
D & D setimde bir d10 ve bahsettiğiniz 5 (artı dahil
etmediğimizi düşündüğüm bir decader

1
Wolfram Alpha cevabı tam olarak hesaplar . İşte dağıtımı doğrudan okuyabileceğiniz olasılık oluşturma işlevi . BTW, bu soru, stats.stackexchange.com/q/3614 ve stats.stackexchange.com/questions/116792 adreslerinde sorulan ve kapsamlı bir şekilde yanıtlanan özel bir durumdur .
whuber

2
@AlecTeal: Sakin ol, sert çocuk. Araştırmanızı yaparsanız, simülasyonu kendim çalıştırmak için bir bilgisayarım olmadığını görürsünüz. Ve 100 kez yuvarlanmak, böyle basit bir soru için etkili görünmüyordu.
Marcos

Yanıtlar:


18

Cebirsel olarak yapmak istemem, ama pmf'yi yeterince hesaplayabilirsiniz (bu sadece bir evrede gerçekten kolay olan evrişim ).

Bunları bir e-tabloda * hesapladım:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

Burada her bir toplam i'yi elde etmenin yollarının sayısıdır ; p ( i ) olasılıktır, burada p ( i ) = n ( i ) / 46080 . En olası sonuçlar zamanın% 5'inden daha az olur.n(i)ip(i)p(i)=n(i)/46080

Y ekseni olasılık olarak yüzde olarak ifade edilir. resim açıklamasını buraya girin

* Kullandığım yöntem, burada açıklanan prosedüre benzer , ancak kullanıcı arabirimi ayrıntıları değiştikçe onu kurmaya dahil olan tam mekanik değişiyor (yaklaşık bir yıl önce güncellediğim halde bu yazı yaklaşık 5 yaşında). Ve bu sefer farklı bir paket kullandım (bu sefer LibreOffice'in Calc'ında yaptım). Yine de, bunun özü bu.


Şaşırtıcı, simetrik bir dağılım beklemiyordum. Sezgimin neden bu kadar uzakta olduğundan emin değilim.
Marcos

6
Bağımsız simetrik rasgele değişkenlerin toplamı da dağılımda simetriktir.
Glen_b -Monica Monica

Güzel bir kural. Bu bir yerde mi yayınlandı?
Marcos

3
Evet, ama benim açımdan bir derginin yayınlanması çok önemsizdi, sadece bir öğrenci için alıştırma olarak ayarlanacaktı. Kökeni simetrik olan rastgele bir değişkenin karakteristik fonksiyonunun gerçek ve hatta olduğu gerçeğini kullanabilirsiniz (ki bu karakteristik fonksiyonun wikipedia sayfasında belirtildiği gibi bulabilirsiniz ) - ve sanırım buna ihtiyacınız var cfs vs pmfs vs-to-one özelliği, ya da hatta çift cf simetrik bir pmf ima oluşturmak için ikili ilişki kullanın ...
Glen_b -Restate Monica

2
... ve hatta işlevlere sahip bir ürünün eşit olduğu gerçeği, ancak aslında, evrişimin nasıl çalıştığının doğrudan düşünülmesinden yeterince açıktır - iki simetrik fonksiyonun (bu durumda pmfs), bir uçta ürünler, diğer uçta, merkezin etrafına simetrik olarak yerleştirilmiş aynı boyutta karşılık gelen bir terim vardır.
Glen_b -Monica

7

Bu yüzden bu kodu yaptım:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

Sonuç bu çizimdir. resim açıklamasını buraya girin

Oldukça Gauss görünümlü. Bence (yine) merkezi limit teoreminde bir varyasyon göstermiş olabiliriz.


2
Hmm, simülasyonunuzdaki en düşük rulo 6'dır. Yuvarlanma olasılığı (veya herhangi bir tek rulo, kalıp kimliğini koruyarak) 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460.800. Prosedürlerim, modellememdeki hataları ortaya çıkarmak için bu miktarın (Nyquist limiti gibi) en az iki kez (belki de 4x) bir numune boyutu N isteyecektir.
Marcos

Nyquist ile yaşadığım deneyim de minimum 4 kat diyor. ... bitti. 2 milyon yeterli değilse, bana ne olması gerektiğini bildirin.
EngrStudent - Monica

3
n

1
@EngrStudent: BTW, sonucunuz CLT'yi doğrulamıyor mu?
Marcos

1
@theDoctor hayır, birçok nedenden dolayı
CLT'yi doğrulamıyor

7

Sezginize biraz yardım:

İlk olarak, bir ölünün tüm yüzlerine bir tane eklerseniz ne olacağını düşünün, örneğin d4. Yani, 1,2,3,4 yerine, yüzler şimdi 2,3,4,5 gösteriyor.

Bu durumu orijinaliyle karşılaştırdığımızda, toplam toplamın artık eskisinden daha yüksek olduğunu görmek kolaydır. Bu , dağılımın şeklinin değişmediği, sadece bir adım kenara taşındığı anlamına gelir .

Şimdi çıkarma , kalıbın her iki tarafından, her kalıbın ortalama değeri.

Bu işaretlenmiş zar verir

  • 32121232
  • 523212123252
  • 7252321212325272

vb.

Şimdi, bu zarların toplamı hala orijinal ile aynı şekle sahip olmalı, sadece aşağı doğru kaydırılmalıdır. Bu toplamın sıfır etrafında simetrik olduğu açık olmalıdır. Bu nedenle orijinal dağılım da simetriktir.


4

P(X=i)=p(i)
Xi0,1,,n(0,1/6,1/6,1/6,1/6,1/6,1/6)p(t)=06p(i)tiq(j)j0,1,,mp(t)q(t)
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

ve bunun doğru olup olmadığını kontrol edebilirsiniz (elle hesaplama). Şimdi asıl soru için, 4,6,8,12,20 tarafı olan beş zar. Her zar için tekdüze problar varsayarak hesaplamayı yapacağım. Sonra:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

Çizim aşağıda gösterilmiştir:

enter image description here

Şimdi bu tam çözümü simülasyonlarla karşılaştırabilirsiniz.


1

Merkezi Limit Teoremi sorunuzu cevaplar. Ayrıntıları ve kanıtları (ve Wikipedia makalesi) biraz beyin bükme olsa da, özü basittir. Wikipedia başına şunu belirtmektedir:

sonlu varyanslara sahip bir dizi bağımsız ve aynı şekilde dağılmış rasgele değişkenin toplamı, değişken sayısı arttıkça normal dağılıma eğilimlidir.

Davanız için bir kanıt taslağı:

“Tüm zarları bir defada yuvarla” dediğinde, tüm zarların her bir rulosu rastgele bir değişkendir.

Zarların üzerinde sonlu sayılar var. Dolayısıyla değerlerinin toplamı sonlu varyansa sahiptir.

Tüm zarları her oynadığınızda, sonucun olasılık dağılımı aynıdır. (Zarlar rulolar arasında değişmez.)

Zarları adil bir şekilde yuvarlarsanız, o zaman her yuvarladığınızda, sonuç bağımsızdır. (Önceki rulolar gelecekteki ruloları etkilemez.)

Bağımsız? Kontrol. Aynı şekilde dağıtılmış mı? Kontrol. Sonlu varyans? Kontrol. Dolayısıyla toplam normal dağılıma doğru yönelir.

Tüm zarların bir rulosu için dağılımın alt uca doğru eğilmiş olması bile fark etmez. Bu dağıtımda klips olması önemli değil. Tüm özetleme onu düzeltir ve simetrik bir gaussian yapar. Göstermek için herhangi bir cebir veya simülasyon bile yapmanız gerekmez! Bu, CLT'nin şaşırtıcı içgörüsüdür.


3
CLT alakalı ve diğer gönderilerin gösterdiği gibi, dağıtımlar kabaca gauss görünümlüdür, sadece 5 bağımsız özdeş olmayan dağıtımın toplamıyla ilgileniyoruz . Dolayısıyla nokta 1) 5, "sonsuzda" uygulanan bir teoremi harekete geçirecek kadar büyük değildir. Nokta 2) vanilya CLt'yi kullanamazsınız, çünkü topladığınız şeyler doğru değildir. Sanırım Lyapunov CLT'ye ihtiyacınız var.
Peter

2
İlgili merkezler hakkında simetrik dağılımlı bazı bağımsız rasgele değişkenlerin toplamının, merkezlerin toplamı hakkında simetrik bir dağılımı olduğunu söylemek için Merkezi Limit Teoremine ihtiyacınız yoktur.
Henry

@Peter: Kanıtlarımın yapısını kaçırıyorsun. OP “hepsini bir kerede yuvarla” diyor. Ben her rulo alıyorum tüm olarak zar bir rastgele değişkenin. Bu rasgele değişkenlerin dağılımı aynıdır. Lyapunov'a gerek yok. Ayrıca OP, “sınırda” demek için aldığım “bunu birden çok kez yapın” diyor, böylece # 1 noktanız geçerli değil. Burada sadece 5 zarlık bir rulo toplamıyoruz.
Paul Cantrell

2
@PaulCantrell Tüm zarların her bir rulosu, birbirinden bağımsız beş bağımsız değişkenin toplamıdır. OP bu meblağın dağılımını soruyor. 5 zardan birçok rulo yapabilirsiniz, ancak bu sadece söz konusu dağıtımdan örnek alıyor, kimse bu örnekleri toplamıyor.
Peter

1
@PaulCantrell Sanırım "Bunu birden çok kez yap" şeklini nasıl yorumladığınıza bağlı. Bunu birkaç kez yapın ve tekrar toplayın (tek bir değer elde edin) veya bunu birkaç kez yapın ve bu örneklerin histogramına bakın (birden fazla değer elde edin). İkinci yorumu aldım.
Peter
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.