Çevirilerin sayısı arttıkça neden kuyruklarla aynı sayıda kafa çevirme olasılığınızın düşük olduğunu açıklamak için İstatistik kavramı?


28

Birkaç kitap okuyarak ve bazı kodlar yazarak olasılık ve istatistik öğrenmeye çalışıyorum ve yazı turalarını simüle ederken birisinin saf sezgisine biraz karşı geldiğimde beni vuran bir şey fark ettim. Eğer adil bir yazı tura durumunda n defa, 1 olarak doğru kuyrukları yakınsak için kafaların oranını n arttıkça, tam olarak beklediğiniz gibi. Ama diğer taraftan, olarak n arttıkça, haline anlaşılmaktadır az olasılıkla bu suretle oranını elde kuyrukları olarak kafaları tam aynı sayıda çevirmek için tam 1.

Örneğin (programımın bir çıktısı)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Benim sorum şudur: Bunu açıklayan istatistik / olasılık teorisinde bir kavram / ilke var mı? Eğer öyleyse, hangi ilke / kavram?

Bunu nasıl yarattığımı görmek isteyen varsa , kodla bağlantı kurun.

-- Düzenle --

Buna değer, işte bunu daha önce kendime anlatıyordum. kere adil bir jeton çevirirseniz ve kafa sayısını sayarsanız, temelde rastgele bir sayı elde edersiniz. Aynı şekilde, aynı şeyi yaparsanız ve kuyrukları sayarsanız, aynı zamanda rastgele bir sayı oluşturursunuz. Yani her ikisini de sayarsanız, gerçekten iki rasgele sayı üretiyorsunuz ve n büyüdükçe, rastgele sayılar büyüyor. Ürettiğiniz rastgele sayılar büyüdükçe, birbirlerini "özlemelerini" sağlama şansı artar. Bunu ilginç yapan şey, iki sayının aslında bir anlamda birbirine bağlı olması, her sayının izolasyonda rastgele olmasına rağmen, oranları büyüdükçe birine yaklaşıyor. Belki sadece benim, ama bu kadar zarif buluyorum. nn


Sezgisel veya matematiksel açıklamalar mı arıyorsunuz?
Glen_b -Regan Monica 19:15 'te

1
İkisi de, gerçekten. Sanırım tür sezgisel anlamda nedenini anlıyorum ama bunun arkasında biçimsel mantık anlamak istiyoruz.
mindcrime

1
Binom olasılıklarını nasıl hesaplayacağınızı ve bu duruma nasıl uygulayabileceğinizi biliyor musunuz? Değilse, yukarıya bak ve hesaplamaları yap.
Mark L. Stone

Vay canına, bu sorunun bir çok iyi cevabı var. Birini değil diğerini kabul etmek zorunda olduğum için kendimi kötü hissediyorum. Tüm cevapları ve bu konudaki görüşlerini paylaşmak için zaman harcayan herkesi takdir ettiğimi söylememe izin verin.
mindcrime

Yanıtlar:


31

Kafa sayısının ve yazı sayısının eşit olduğu durumun, "kafa aldığınız zamanın tam yarısı" ile aynı olduğunu unutmayın. Öyleyse, atış sayısının yarı yarıya düşüp düşmediğini görmek için kafa sayısını saymaya devam edelim veya kafa oranını 0,5 ile eşit olarak karşılaştıralım.

Ne kadar fazla çevirirseniz, sahip olabileceğiniz olası kafa sayısı o kadar fazla olur - dağılım daha fazla yayılır (örneğin, fırlatma sayısı arttıkça olasılığın% 95'ini içeren kafa sayısı için bir aralık artar) Yani, tam olarak yarım kafaların olasılığı, daha fazla fırlattığımızda aşağı inme eğiliminde olacaktır.

Buna bağlı olarak, kafaların oranı daha olası değerleri alacaktır; burada 100 atıştan 200 atışa geçtiğimiz yer:

görüntü tanımını buraya girin

100 atışla 0,49 kafa veya 0,50 kafa veya 0,51 kafa (ancak bu değerler arasında hiçbir şey yoktur) oranını gözlemleyebiliriz, ancak 200 atışla 0,49 veya 0,495 veya 0,50 veya 0,505 veya 0,510 gözlemleyebiliriz. olasılık “örtmek” için daha fazla değere sahiptir ve bu nedenle her biri daha küçük bir pay alma eğilimindedir.

Sahip daha düşünün bazı olasılık ile fırlatır p ı almanın ı (bu olasılıkları biliyorum ama bu bölümü için kritik değil) kafaları ve iki tane daha fırlatır ekleyin. İçinde 2 N fırlatır, n kafaları en olası sonuç (bir s , n > p , n ± 12npii2nnpn>pn±1 ve oradan azalır).

kafalarını 2 n + 2 fırlatmasında kullanma şansı nedir ?n+12n+2

(Bu olasılıkları ile etiketleyin, böylece onları öncekilerle karıştırmayın; aynı zamanda P (HH) 'nın sonraki iki fırında "Head, Head" olasılığı olsun.q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

yani, iki para daha eklerseniz, orta değerin olasılığı doğal olarak azalır, çünkü en muhtemel (orta) değeri, her iki tarafın da küçük değerlerinin ortalaması ile ortalaması alır)

Yani sürece gibi doğru rahat zirve ortada olacağı için ( Gibi), tam yarım kafaların olasılık azaltmak gerekir n artar.2n=2,4,6,...n


Aslında için büyük olduğunu gösterebilir , p , n ile orantılı olarak düşer 1npn (şaşırtıcı bir şekilde, standart kafa sayısının dağılımı normale yaklaştığından ve kafa oranındaki değişiminnile azaldığından).1nn


İstenildiği gibi, yukarıdaki arsaya yakın bir şey üreten R kodu:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
Grafiğinin 1000 kelimelik olması konusunda yukarıdaki @RustyStatistician ile aynı fikirdeyim. İşaretçinin kodlaması için ekstra kredi.
TomRoche

Müthiş şekil ve açıklama!

@Tom başlıktaki "200" kelimesini yeşil yapmak dışında her şeyi yapan bir kod ekledim.
Glen_b

1
@Glen_b Bir başka harika yazı ve kod satırlarını paylaşmanın cömertliği için teşekkür ederiz. Güzel arsa! Bunu itiraf etmek zor, ama kavramınızın matematiksel ifadesinde ve özellikle de büyük harfinin kullanımında sorun yaşıyorum . P
Antoni Parellada

1
@Antoni sadece "iki ek fırlatır üzerinde 'Kafa, Başkanı' alma olasılığını" anlamına gelir. N + 1 kafalarını 2n + 2 fırlatmaya sokmak için, 2n fırlatılarak n-1 kafalara (ve sonra 2 kafa attı) veya n kafaya (ve sonra 1 kafa attı) veya n + 1 kafaya (ve sonra fırlatılmış) sahip olmalısınız 0 kafa). P(HH)
Glen_b -Reinstate Monica

19

Peki biz biliyoruz Büyük Sayılar Kanunu adil bir yazı tura eğer, yani senin Denemesidir ilk sonuca garanti budur defa, 1'e doğru kuyrukları yakınsak için kafaların oranını n artar. nn

Yani orada sorun yok. Ancak, tüm Büyük Sayılar Yasası hakkında bize bu senaryoda anlatır.

Ama şimdi, bu problemi daha sezgisel olarak düşünün. Bozuk parayı az miktarda çevirmeyi düşünün, örneğin: .n=2,4,8,10

Bir madeni parayı iki kez çevirdiğinizde, yani ise, iki çevirinin olası senaryolarını düşünün. (Burada H , kafaları, T ise kuyrukları belirtir). İlk vuruşta H almış olabilirsiniz ve ikinci vuruşta T almış olabilirsiniz . Ama bu iki çevirinin ortaya çıkmasının bir yoludur. Ayrıca ilk T çevirme ve ikinci çevirme H ve diğer olası kombinasyonlara da sahip olabilirsiniz. Günün sonunda, 2 jeton çevirdiğinizde, iki fiş üzerinde görebileceğiniz olası kombinasyonlar S = { H H , H T ,n=2HTHTTH ve n = 2 saygısı için 4 olası senaryo vardır

S={HH,HT,TH,TT}
n=2 parayı .

Eğer 4 para çevirmek olsaydı o görebildiğimiz kombinasyonunun muhtemel olması miktarda

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

n=8

n=10

n2n

n=2, we know that the probability of getting exactly the same number of Heads and Tails (i.e., as you put it a ratio of exactly 1) is

Pr(Ratio of exactly 1)=24=0.5
When n=4, we know that the probability of getting exactly the same number of Heads and Tails is
Pr(Ratio of exactly 1)=616=0.375

And in general, as n tends to grow larger we have that that the probability of getting exactly the same number of Heads and Tails goes to 0.

In other words, as n, we have that

Pr(Ratio of exactly 1)0

And so, to answer your question. Really what you are observing is just a consequence of the fact that there will be far more combinations of coin flips where the number of heads and tails are not equal as compared to the number of combinations where they are equal.



As @Mark L. Stone suggests, if you are comfortable with the binomial formula and binomial random variables, then you can use that to show the same argument.

Let X be the number of heads recorded when flipping a fair coin n times. we can regard X as a random variable coming from a binomial distribution, i.e., XBin(n,p=0.5) (here we assume p=0.5 because we are dealing with a fair coin) then the probability of getting exactly the same number of heads as the number of tails (i.e., a ratio of exactly 1) is

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

Now, once again, as n tends to grow large, the above expression tends towards 0 because (nn/2)0.5n0 as n.


2
You need to say a bit more than that 0.5n0 as n ... you also need to say something about the (nn/2) as well. (For comparison: just because 0.5n0, doesn't mean n!0.5n0).
Silverfish

@Glen_b I don't have enough points to comment on your post, but awesome graphic!

Thanks @RustyStatistician, that helps a lot. The first part of your explanation pretty much matches the way I was thinking of it, but I am not quite far enough along with my stats yet to know how to work it out using the Binomial distribution. I basically read over my book once, not working out problems or anything, and now I'm going back through from the beginning, and writing code to explore various aspects of the material.
mindcrime

@mindcrime sounds great! Glad I could help.

5

See Pascal's Triangle.

The likelihood of coin flip outcomes is represented by the numbers along the bottom row. The outcome of equal heads and tails is the middle number. As the tree grows larger (i.e., more flips), the middle number becomes a smaller proportion of the sum of the bottom row.



1

While the ratio of heads to tails converges to 1, the range of possible numbers becomes wider. (I'm making the numbers up). Say for 100 throws the probability is 90% that you have between 45% and 55% heads. That's 90% that you get 45 to 55 heads. 11 possibilities for the number of heads. About 9% roughly that you get equal numbers of heads and tails.

Say for 10,000 throws the probability is 95% that you get between 49% and 51% heads. So the ratio has come a lot closer to 1. But now you have between 4,900 and 5,100 heads. 201 possibilities. Chance of equal numbers is only roughly about 0.5%.

And with a million throws you are quite sure to have between 49.9% and 50.1% heads. That's a range from 499,000 to 501,000 heads. 2,001 possibilities. The chance is now down to 0.05%.

Ok, the maths was made up. But this should give you an idea about the "why". Even though the ratio comes closer to 1, the number of possibilities becomes greater, so that hitting exactly half head, half tails, becomes less and less likely.

Another practical effect: It is unlikely in practice that you have a coin where the probability of throwing heads is exactly 50%. It might be 49.99371% if you have a really good coin. For small number of throws this doesn't make a difference. For large numbers, the percentage of heads will converge to 49.99371%, not 50%. If the number of throws is large enough, throwing 50% or more heads will become very, very unlikely.


0

Well, one thing to note is that with an even number of flips (otherwise the probability of equal heads and tails flips is of course exactly zero), the most probable outcome will always be the one with exactly as many heads flips as tails flips.

The distribution of n flips is given by the coefficients of the polynomial

(1+x2)n.
So for even n, the probability is
pn=2n(nn/2).

Using Stirling's approximation for n!, you arrive at something like

p1πn/2
for the probability of exactly n/2 heads (and correspondingly tails) flips for n overall flips. So the absolute probability of this outcome converges to 0 but much slower than most of the other outcomes, with the extreme cases of 0 heads (or alternatively 0 tails) flips being 2n.

2
Your answer could be improved by carefully defining quantities in your expressions. What is n? What is p?
Sycorax says Reinstate Monica

0

Suppose you flip a coin twice. There are four possible outcomes: HH, HT, TH, and TT. In two of these, you have an equal number of heads and tails, so there's a 50% chance that you get the same number of heads and tails.

Now suppose you flip a coin 4,306,492,102 times. Do you expect a 50 percent chance that you'll wind up with exactly 2,153,246,051 heads and 2,153,246,051 tails?


No, my intuition told me that the chances of getting an exact match were low, just because the numbers were getting larger. But I wanted to simulate it just to confirm my thought. When I saw that it turned out that way, I was intrigued as to the formal reasoning behind why it is that way. It strikes me as interesting that the resulting ratio is converging towards 1 while simultaneously becoming less likely to be exactly 1.
mindcrime

3
One way of thinking about that is that for large n there are many more ways to be close to 50-50 than there are for small n.
Daniel McLaury
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.