Doğum Günü sorusunun gerçek cevabı nedir?


13

"Bir sınıf, aynı doğum günü olan iki kişiyi en az% 50 bulma olasılığını yaratmak için ne kadar büyük olmalı?"

Facebook'ta 360 arkadaşım var ve beklendiği gibi doğum günlerinin dağılımı hiç de aynı değil. Bir günüm aynı doğum günü olan 9 arkadaşım var. (Büyük tatiller ve sevgililer gününden 9 ay sonra büyük olanlar gibi görünüyor, lol ..) Yani, bazı günlerin bir doğum günü için daha muhtemel olduğu göz önüne alındığında, 23 sayısının bir üst sınır olduğunu varsayıyorum.

Bu soruna ilişkin daha iyi bir tahmin var mı?


3
360 kişilik bir örnek, yılın 365 günü boyunca doğum günlerinin dağılımı için büyük bir örnek oluşturmaz ... Böyle küçük bir örnek üzerinde kesinlikle tekdüzeliği kontrol edemezsiniz.
Xi'an

Bir kişi bir doğum günü var, ikinci bir kişi olduğunu ihtimali nedir gelmez aynı doğum gününü paylaşan? 364/365, üçüncü bir kişinin her iki doğum gününü paylaşmaması ihtimali nedir? (364/365) * (363/365). Bir olasılık olana kadar bunu genişletin < 50%. Bu, hiç kimsenin aynı doğum gününe sahip olmadığı ihtimalleri anlamına gelir , bu da en az iki kişinin doğum gününü paylaşma olasılığının olacağı anlamına gelir > 50%.
zzzzBov

8
Rastgele arkadaşların olduğunu mu varsaymalıyız ?
James

1
@zzzzBov - OP'nin ne istediğini anlamıyorsunuz. Bu, biz şans her biri her doğum günü eşit olasılıkla olduğunu varsayalım yaklaşımdır olma senin. OP, 1 Ocak'ta doğduğunu söylerken tahminin ne olacağını soruyor. 15 Şubat'ta doğması muhtemel değil1365
olasılık

Yanıtlar:


18

Neyse ki birisi ilgili soru hakkında biraz tartışma ile gerçek doğum günü verileri yayınladı (dağıtım üniformasıdır). Bunu ve sorunuzun cevabının görünüşe göre 23 olduğunu göstermek için kullanabiliriz - teorik cevapla aynı .

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
Gerçekten de, bir ile gösterilebilir Schur konveksite için bu, herhangi bir doğum düzgün olmayan dağılım, bir maç olasılığı homojen durumda kadar büyük, en az bir. Bu Egzersiz 13.7 J. Michael Steele ait Matematiksel Eşitsizlikler Art An Introduction: Cauchy-Schwarz Usta Sınıfı , Cambridge University Press, 2004, syf. 206 .
kardinal

2
@ Xi'an: Gerçekten. Şimdi, sadece yüksek kaliteli, yüksek okurluklu bir istatistik dergisi için kitap incelemesi yapan birini tanışsaydım, istatistikçilere daha fazla görünürlük sağlamak için gözden geçirmelerini öneririm ... ama böyle bir insan nerede bulunur
kardinal

3
(Hemen önceki yorumumu merak edenler için, @ Xi'an'ın Şans için yeni atanan kitap eleştirmeni olduğu gerçeğine atıfta bulunuyor .)
kardinal

2
Xi'an @, bu çıkış ve ne düşündüğünüzü bakın: table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE))))).
whuber

3
Muhtemelen, R cognoscenti hariç, @ Xi'an ve ben tarafından önceki yorumlarda yer alan kodun OP'nin durumunu taklit ettiği açık değil. Çalıştırmak, eşit olarak dağıtılmış bir popülasyondan rastgele seçilen 360 kişiden 9'unun veya daha fazla kişinin doğum gününü paylaşma şansının 100.000'den sadece 40'ı olduğunu tespit ediyor. Maksimum paylaşılan doğum günü sayısı için en olası değer
5'dir
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.