Düzgün dağılmış sayılar arasındaki farklar eşit dağılmış mı?


22

6 taraflı bir kalıbı çok defa yuvarlıyoruz.

Bir rulo ve bir önceki rulo arasındaki farkın (mutlak değer) hesaplanması, farklılıkların eşit bir şekilde dağılması bekleniyor mu?

10 rulo ile göstermek için:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

Misiniz diffdeğerleri eşit dağıtılacak?


13
Bir fikir edinmek için en az bir histogram çizilir
gunes


Bu ödev gibi görünüyor ....
Manu H

@Manu H, sizi temin ederim ev ödevi günleri geride kaldı.
HeyJude

Yanıtlar:


37

Hayır üniforma değil

Mutlak farklar için 36 eşit olasılık olasılığını sayabilirsiniz

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

Bu da mutlak farklar için olasılık dağılımı verir.

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas Bu cevaptaki tablo açıkça sizin iddianızla çelişmektedir: örneğin, muhtemel farklılıklardan yalnızca birinin 5, 6'sının 0 olduğunu göstermektedir.
whuber

13
@onurcanbektas Masayı düşünmek için sizi bir kez daha davet ediyorum. Yalnızca iki mutlak 5 farklılığına sahip olduğu için, ikiden fazla farkın 5'e eşit olamayacağı açık değil mi?
whuber

14
@onurcanbektas Basit farklar için (yani işaretlerle, yani -5 ile +5 arasında tamsayılarla), dağılım 0'da modla simetrik bir üçgen dağılımdır (en muhtemel değer). modu 1'dir.
Henry,

2
Yine de, işaretlenmiş fark modulo 6'nın eşit olarak dağıldığını belirtmekte fayda var.
Federico Poloni

2
@FedericoPoloni Bu önemsiz derecede açık değil mi? Yani ben asla gerçekten bu konuda, yorum okumadan önce, ama durumun böyle olması gerektiğini çok açık olmasına rağmen
Cruncher

21

Olasılıklar ve reel sayılarla ilgili yalnızca en temel aksiyomları kullanarak, kişi çok daha güçlü bir ifadeyi kanıtlayabilir:

Herhangi iki bağımsız, aynı şekilde dağıtılmış sabit olmayan rastgele değer XY farkı hiçbir zaman ayrı bir düzgün dağılıma sahip değildir.

(Sürekli değişkenler için benzer bir ifade iki rv farkının Tekdüzen PDF'sinde kanıtlanmıştır .)

Buradaki fikir, XY aşırı bir değer olması olasılığının, XY sıfır olma şansından daha az olması gerektiğidir , çünkü XY maksimize etmenin (söyleyebilmenin) tek bir yolu vardır, oysa farkı sıfırlamanın birçok yolu vardır. , çünkü X ve Y aynı dağılıma sahiptir ve bu nedenle birbirlerine eşit olabilirler. İşte detaylar.

İlk varsayımsal iki değişken olduğunu gözlemlemek X ve Y Söz konusu her sadece sınırlı sayıda elde edebilirsiniz n en az olacak, çünkü pozitif olasılığı değerlerin n belirgin farklar ve düzgün bir dağılım atar hepsini eşit olasılık. Eğer n sonsuzsa, o zaman pozitif, eşit olasılığa sahip olası farkların sayısı olacaktır, bu nedenle şanslarının toplamı sonsuz olacaktır, bu imkansızdır.

Sonra , farklılıkların sayısı sınırlı olduğu için, aralarında en büyükler olacaktır. En küçük değeri çıkarılarak zaman büyük fark, sadece elde edilebilir Y bu --let çağrısına m ve varsayalım bu olasılık vardır q=Pr(Y=m) --from büyük değeri X --let çağrısı bu, bir M ile p=Pr(X=M). Çünkü X ve Y bağımsız, bu farkın şans bu şansı ürünüdür,

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

Son olarak , X ve Y aynı dağılıma sahip olduklarından, farklılıklarının 0. değerini üretebileceği birçok yol vardır. Bu yollar arasında X=Y=m ve X=Y=M. olduğu durumlar arasındadır . Çünkü bu dağılım sabit değil,m ,M. farklıdır . Gösteriyor ki bu iki olgu ayrık olaylardır ve bu nedenle katkıda bulunmalıdır, en azındanbir miktarp2+q2 şansa olduğuXYsıfır; yani,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

Sayıların kareleri, negatif olmayan yana 0(pq)2, biz çıkarsamak nereden () bu

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

X - Y dağılımını gösterenXY tek biçimli değildir, QED.

Yoruma cevap olarak düzenle

Mutlak farklılıkların benzer bir analizi |XY|X ve Y aynı dağılıma sahip olduklarından, m=M. olduğunu gözlemler . Bu, Pr(XY=|Mm|)=2pq.Aynı cebirsel teknik hemen hemen aynı sonucu verir, ancak 2 p q = 2 p q + ( p incelememizi gerektirir ( X - Y = | M - 2 ve 2 p q + p2pq=2pq+(pq)22pq+p2+q2=1. denklem sisteminin tek bir çözümü vardır Bup=q=1/2 makul bir madeni para tekabül eden (bir "iki taraflı kalıp"). Bu istisna dışında, mutlak farklılıkların sonucu, farklılıklarla aynıdır ve daha önce verilmiş olan temel sebeplerin aynısıdır: yani, iki farklı rasgele değişkenin mutlak farklılıkları, ikiden fazla farklı farklılık olduğunda eşit olarak dağıtılamaz pozitif olasılık ile.

(düzenlemenin sonu)


Bu sonucu, biraz daha karmaşık bir şey hakkında soran soruya uygulayalım.

Kalıbın her bağımsız rulosunu ( haksız bir kalıp olabilir ) rasgele bir değişken Xi, i=1,2,,n. modelleyin . Bu n silindirlerde gözlenen farklar ΔXi=Xi+1Xi. sayılarıdır . Bu n1 sayılarının eşit dağılım gösterdiğini merak edebiliriz . Bu gerçekten istatistiksel beklentilerle ilgili bir soru: beklenen number X i sayısı ΔXiMesela sıfıra eşit mi? Beklenen ΔXi1 eşit beklenen sayı nedir ? Vesaire vesaire.

Bu sorunun sorunlu yönü olduğunu ΔXi olan değil , örneğin: Bağımsız ΔX1=X2X1 ve ΔX2=X3X2 aynı rulo içeren X2.

Ancak, bu gerçekten bir zorluk değil. İstatistiksel beklenti ilave olduğundan ve tüm farklılıklar aynı dağılıma sahip olduğundan , farklılıkların olası herhangi bir k değerini seçersek , farkın n'nin tüm sırasındaki k eşit olması beklenen sayı, beklenen miktarın sadece n - 1 katıdır. işlemin tek bir basamağında farkın k'ye eşit olması . Bu tek adımlı beklenti Pr ( Δ X i = k ) (herhangi bir i için ). Bu beklentiler tüm k için aynı olacaktır (yani, tek tip)nn1kPr(ΔXi=k)ik) eğer ve sadece tek bir ΔXi. için aynılarsa i . Ancak, ΔXi , kalıp önyargılı olsa bile düzgün bir dağılıma sahip olmadığını gördük . Bu nedenle, bu zayıf frekans beklentisinde bile, silindirlerin farklılıkları aynı değildir.


@Michael Good point: Soruyu, açıklandığı gibi (açıkça mutlak farklılıkları ifade eder) değil, ("farklılıklar" anlamına gelir) sorulduğu gibi cevapladım. Aynı teknik geçerlidir - biri hem maksimum hem de min farklılıkları dikkate almalıdır. Bernoulli burada bu (sıfır) ile birlikte iki olasılık vardır durumda, olan eşitlik olsun sonucu (benzersiz örneğin olduğunu gösteren) gelir. (1/2)
whuber

Bunun belirli bir versiyonunu kanıtlayan bir başka cevap burada .
Monica’yı

Teşekkürler @Ben: O konuyu unutmuştum. Çünkü bu daha iyi bir referans, şimdi bu cevapta doğrudan ona bağlantı veriyorum.
whuber

12

Sezgisel bir seviyede, rastgele bir olay ancak sonuçlarının tümü eşit derecede muhtemel olduğunda eşit olarak dağıtılabilir.

Bu, söz konusu rastgele olay için geçerli midir? İki zar rulosu arasındaki mutlak fark?

Bu durumda uç noktalara bakmak yeterlidir - bu farkın alabileceği en büyük ve en küçük değerler hangileridir?

Açıkçası, 0 en küçüktür (mutlak farklılıklara bakıyoruz ve rulolar aynı olabilir) ve 5 en büyüğüdür ( 6vs 1).

Olaydan 0daha fazla (veya daha az) gerçekleşmesi muhtemel olduğunu göstererek düzensiz olduğunu gösterebiliriz 5.

Bir bakışta, 5'in gerçekleşmesi için sadece iki yol vardır - eğer ilk zar 6 ve ikinci 1 ise, veya tam tersi . 0 kaç yolla ortaya çıkabilir?


1
+1 Ben bu konunun kalbine alır düşünüyorum. Sonunda aynı gözlemi temel alan sorunun genelleştirmesini yayınladım.
whuber

5

Henry tarafından sunulduğu gibi , düzgün dağılmış dağılımların farklılıkları düzgün dağılmaz.

Bunu benzetilmiş verilerle göstermek için çok basit bir R betiği kullanabiliriz:

barplot(table(sample(x=1:6, size=10000, replace=T)))

enter image description here

Bunun gerçekten tek biçimli bir dağılım ürettiğini görüyoruz. Şimdi bu rastgele iki rasgele örneğin mutlak farklarının bu dağılımdan dağılımına bakalım.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

enter image description here


6
Why does this have anything to do with the CLT, which concerns the asymptotic distribution of means of large numbers of iid values?
whuber

2
I like the connection you originally made with CLT. Let n be the number of samples to be added (or subtracted) from the original uniform distribution. CLT implies that for large n the distribution will tend toward normal. This in turn implies that the distribution cannot remain uniform for any n>1, such as n=2 which is what OP is asking. (If this isn't self-explanatory, consider that if the sum were uniformly distributed when n=2, reindexing would imply that it is also uniform when n=4, etc, including for large n.)
krubo

3
@Krubo The original question asks about the distribution of differences between successive rolls of a die. The CLT has nothing to say about that. Indeed, no matter how many times the die is rolled, the distribution of those differences will not approach normality.
whuber

Does this distribution tend to uniform as the number of die faces tends to infinity? Not sure how to go about showing that, but intuitively it feels like it heads in that direction, but I don't know if it get asymptotically "blocked" somewhere before flattening enough
Cruncher

@Cruncher you can easily change the number of die faces in the R-Code. The more faces there are, the more apparent the stairwairs nature of the distribution becomes. '1' is always the peak of that stair and with larger differences the probabilities approximate zero. Additionally, difference of '0' is distinctly rarer than '1'. (at least if the die's smallest value is '1')
LuckyPal

2

Others have worked the calculations, I will give you an answer that seems more intuitive to me. You want to study the sum of two unifrom r.v. (Z = X + (-Y)), the overall distribution is the (discrete) convolution product :

P(Z=z)=k=P(X=k)P(Y=zk)

This sum is rather intuitive : the probability to get z, is the sum of the probabilities to get something with X (noted k here) and the complement to z with -Y.

From signal processing, we know how the convolution product behave:

  • The convolution product of two uniform function (two rectangles) will give a triangle. This is illustrated by wikipedia for continuous functions:

enter image description here

  • You can understand what happen here : as z move up (the vertical dotted line) the common domain of both rectangle move up then down, which correspond to the probability to get z.

  • More generally we know that the only functions that are stable by convolution are those of the gaussian familly. i.e. Only gaussian distribution are stable by addition (or more generally, linear combination). This is also meaning that you don't get a uniform distribution when combining uniform distributions.

As to why we get those results, the answer lies in the Fourrier decomposition of those functions. The Fourrier transformation of a convolution product being the simple product of the Fourrier transformations of each function. This give direct links between the fourrier coefficients of the rectangle and triangle functions.


Please check the validity of your claims and the logic of your answer. The question isn't whether the convolution of two uniform distributions is uniform: it's whether the convolution of some distribution and its reversal can be uniform. And there are far more distributional families than the Gaussian that are stable under convolution (modulo standardization, of course): see en.wikipedia.org/wiki/Stable_distribution
whuber

You are right about stable distributions. For the question, I am pretty sure this is about the difference of two random values with uniform distribution (as indicated by the title). The question whether the convolution of some distribution and its reversal can be uniform is larger than what is asked here.
lcrmorin

1

If x and y are two consecutive dice rolls, you can visualize |xy|=k (for k=0,1,2,3,4,5) as follows where each color corresponds to a different value of k:

consecutive dice rolls difference visualization

As you can easily see, the number of points for each color is not the same; therefore, the differences are not uniformly distributed.


0

Let Dt denote the difference and X the value of the roll, then P(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

So the function P(Dt=d) is not constant in d. This means that the distribution is not uniform.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.