Artık bir günde doğma olasılığı?


31

Bugünün artık bir gün olduğu göz önüne alındığında, artık bir artık günde doğma olasılığını bilen var mı?


30
Doğumların yıl boyunca aynı şekilde dağılmadığını unutmayın, bu nedenle rastgele seçilen bir günün artık bir gün olma olasılığı bir doğum tarihi ile aynı değildir.
Ben Millwood

17
Of kime doğmak? Tarihte tüm insanlar? Bugün? Tüm insanlar yaşıyor mu? Prospektif olarak geleceğe mi? Bahsettiği olaylar iyi tanımlanmadıkça olasılıklar anlamsızdır.
whuber

15
Bugün doğan insanların% 100'ü olacak. Bu yardımcı olur mu?
gecekondu

8
Birçok ebeveyn, çocuklarının artık günü doğmasını istemiyor. Böylece, zamanlanmış C-bölümlerinin yükselmesiyle birlikte, olasılık rastgele bir günden daha düşük olacaktır. fivethirtyeight.com/features/…
James Lawruk

3
@Whuber ile katılıyorum, sorunun kötü tanımlandığını. Olasılık alanının doğru tanımlanması olmadan soru cevaplanamaz. Bu yüzden aşağı oy.
mpiktas

Yanıtlar:


24

Emin. Daha ayrıntılı bir açıklama için buraya bakınız: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .

Ancak esasen yazar, “2 bin yılda 485 artık yıl var. Öyleyse, 2 bin yılda toplam gün var. bunlardan (artık yıllarda) ait 485, bu nedenle olasılığıdır 485 / 730485 = ,0006639424 "485(366)+(2000485)(365)=730485485/730485=0.0006639424


9
Neden 1 olarak hesaplanamıyor / (4 yıldaki gün sayısı) = 1/1461 = 0.00068 ?
Siddhesh,

21
@ Siddhesh Yüzyıllar ile ilgili bir kural var. Yani, örneğin 2100 artık bir yıl değil
Rentrop

8
@Siddhesh, Ne yazık ki, o kadar basit değil. Artık yıllar biraz daha karmaşık. Ortalama bir yıl uzunluğu aslında, 365.25 değil 365.2425 gündür. Wikipedia artık sayfasında yazılan "Gregoryen takvimi. Bu tam olarak 400'e bölünemez. [3] 2000 ve 2400 yılları artık yıl, 1800, 1900, 2100, 2200, 2300 ve 2500 ortak yıllar. "
StatsStudent,

10
Neden 2000 yılı düşünmeniz gerektiğini anlamıyorum; artık yıllar 400 yıllık bir döngüde, neden sadece “400 yılda 97 artık yıl” demedi?
Philip Kendall,

7
Neden yüzyıllar boyunca "iptal edilmiş" sıçrama günleri gibi küçük etkileri 400'ün katları değil, diğer taraftan, yalnızca 29 Şubat'tan önce gecikmiş ya da 29 Şubat'tan önce ortaya çıkmış, sadece tasarruf etmek için dış etkenler üzerinde bir etken olarak görmemeliyiz. Rahatsızlıktan kaynaklanan çocuk (veya başka nedenlerle)? - En azından burada Almanya'da bir doğumun 29 Şubat'ta meydana gelme olasılığı neredeyse sıfırdır.
Monica,

23

İstatistikleri kullanarak bu olasılığı doğru bir şekilde tahmin etmek için, doğumun nerede gerçekleştiğini bilmek faydalı olacaktır.

Bu sayfa http://chmullig.com/2012/06/births-by-day-of-year/ , günlük doğum sayısının bir alt kümesini gösteren bir grafiğe sahiptir (29’u 4’le çarparak yanlış ve istenmeyen bir durumdur). Bu soru için, fakat aynı zamanda orijinal verilere de bağlanır ve ABD'de ne bekleyebileceğinize dair kabaca bir gösterge verir. Bu eğrinin diğer ülkeler için ve özellikle diğer kıtalar için geçerli olmadığını varsayacağım. Özellikle güney yarım küre ve ekvatoral bölge, iklimin belirleyici bir faktör olduğu varsayımıyla bu sonuçlardan önemli bir türev gösterebilir.

Ayrıca, “seçmeli doğum” konusu da var ( http://bmjopen.bmj.com/content/3/8/e002920.full'un yazarlarına değindi ) - dünyanın daha fakir bölgelerinde, farklı bir şey beklemekteydim doğumların dağılımı, çünkü (acil olmayan) sezaryen bölümleri veya indüklenen doğum, gelişmiş ülkelere göre daha nadirdir. Bu, doğumların son dağılımını çarpıtır.

Amerikan verilerini kullanarak, 29 Şubat'ta ~ 71 Milyon doğum (kaba ortalama * 366) ve 46.000 doğum olduğunu varsayarak, artık yılların veri dağılımındaki dağılımını düzeltmeyeceğini, kesin sürenin belirtilmediği için verip verme ihtimaline ulaşıyorum. yaklaşık ~ 0.000648. Bu, doğumların düz bir dağılımına bakıldığında beklenecek değerin biraz altında ve bu nedenle grafikte verilen genel izlenim doğrultusunda.

Motive edici bir okuyucuya bu kaba tahminin önem testini bırakacağım. Ancak, 29'unun (düzeltilmemiş olsa da - 2000 yılı verilere ortalamanın altında bir önyargı enjekte ediyor), zaten düşük Şubat standartları için bile düşük puanlar aldığına göre, eşit dağılımın sıfır-mısırhosesinin reddedileceğine dair görece yüksek bir güvence varım.


1
Veri setinde 30 Şubat ve 31 doğum tarihi bulunmaktadır. Bu komik. Analizden önce iyi bir temizlik yapması gerekiyor, ancak harika olan birçok veriye sahip.
Aksakal

22

Bence bu sorunun cevabı sadece deneysel olabilir. Herhangi bir teorik cevap, doğum günü seçim olgusu, mevsimsellik vs. hesaplanmadan hatalı olacaktır. Bunların teorik olarak ele alınması imkansızdır.

Doğum günü verilerini gizlilik nedeniyle ABD'de bulmak zor. Burada anonim bir veri var . ABD'deki sigorta uygulamalarından. Bir sık ​​kullanılan alıntı gibi diğer raporlardan farkı NYT makalesi bir yılda basit gün sıralaması yerine, doğum sıklığını tarihe göre sıralamasıdır. Zayıf nokta kuşkusuz, örnekleme yanlılığı, sigortadan geldiği için: sigortasız insanlar dahil edilmiyor vs.

Verilere göre, 29 Şubat’ta toplam 481040’ta 325 doğum vardı. Roy Murphy’ye göre, örnek 1981’den 1994’e kadar yayıldı . Herhangi bir düzeltme yapılmadan, olasılık , 29 Şubat 1981 ile 1994 arasında doğma olasılığının % 0.0675'i olacaktır.

Sen (1/4 yakındır Artık yıllarda sıklığı, hesaba katarak olasılığını ayarlayabilirsiniz tam olarak gerçi bu sayısı çarpılarak örneğin) 0.079% tahminine gelmesi. Burada, koşullu olasılığı s artık bir yıl içinde Şubat 29 doğmuş olmak gözlenen frekansına bağlı olduğu F o = 325 frekans ile f L = 3 : Bir örnekteki artık yıl arasında F o = f L / N F p , burada , N =14/12pFo=325fL=3

Fo=fL/NFp,
N=14 bir örnekteki yıl sayısıdır ve toplam doğum sıklığıdır.F=481040

Normal olarak, artık yıl olasılığıdır , bu nedenle, uzun dönem ortalama olasılık P L Şubat 29 doğmuş olmak sahiptir: p L = p Ls s LKpL1/4PL

PL=pLppLNfLFoF0.079%

Sıçrama yılında doğmuş olmanız şartıyla 29 Şubat'ta doğmuş olmak için şartlı olasılık ile ilgilenebilirsiniz : p = Np

p=NfLFoF0.32%

Yani, arasındaki bağlantıPLp , belirli bir yılda doğmuş olmak ihtimali üniforma olduğunu ve değişmediğini bazı varsayımları çift, örneğin dayanmaktadır.

Tabii ki, bu tartışma ABD merkezli idi. Diğer ülkelerdeki kalıpların ne olduğunu kim bilebilir?

GÜNCELLEME: Otomatik olarak OP'nin Gregoryen takvimi olduğunu varsaydık. Ay takvimi gibi farklı takvimler düşünürseniz daha da ilginçleşir.Artık yılların her 30 yılda bir olduğu Ayri Hicri .

GÜNCELLEME 2:

pFp=1,527Amitabh Chandra, Harvard University

Şimdi, Gregoryen takviminde çok tuhaf günler: 1 Ocak, 25 Aralık ve Deb 29'un en popüler doğum günleri olarak rastgele gelmesi ne kadar muhtemel? Bence pek rastlantısal bir durum değil. Bu nedenle, Hicri gibi diğer takvimlerde neler olup bittiğini görmek daha da ilginç.

GÜNCELLEME 3:

PL,p

p^1/3660.27
P^Lp366365*4+10.068

GÜNCELLEME 4:

Ben Millwood, doğumların yılın gününe göre dağılımının tek tip olmadığını belirtti. Bu ifadeyi test edebilir miyiz? Veri setimi kullanarak çalıştırabilirizχ2 Dağılımın tekdüze olduğu varsayımına dayanarak teorik dağılımın sınanması . Sonuç reddetmedir, yani dağılım tekdüze görünmez.

Teorik dağılım böyle inşa edilmiştir. Doğum sıklığının tüm takvim günleri boyunca tek tip olduğunu varsayıyoruz, yani 14 yıl boyunca14*365+3günler. Daha sonra günleri 366 olan yılın günlerine ayırıyoruz. Açıkçası sadece 3 artık gün ve 14 artık olmayan gün ile karşılaşıldı. Aşağıda benim MATLAB kodum ve teorik ve ampiriklerin karşılaştırılması için dağıtım grafiği.

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

ÇIKTI:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

görüntü tanımını buraya girin


3
Bu faydalı bir analiz (+1). Analiz ettiğim frekanslar ile soruda sorulan (belirsiz bir şekilde tanımlanmış) olasılık arasında varsa ne kadar bağlantı olduğunu merak etmeme neden oluyor .
whuber

1
@whuber, cevabımdaki olasılıklar sigorta uygulamalarının analizi veya bazı kullanıcı verileri gibi durumlar içindir. Örneğin, bir web siteniz var ve sorunlu kullanıcı verilerini işaretlemek istiyorsunuz. 29 Şubat doğum günlerinin sıklığını benim olasılıklarımla karşılaştırabilirsin. Ancak, eğer bir aile planlıyorsanız ve bu soruyu soruyorsanız, numaralarım işe yaramaz, hemen hemen işe yaramaz. Bunun nedeni, çiftin tam olarak ne zaman çoğaltıldığı ya da doğurganlık ve örneğin doğum günü tarihinin ana belirleyicisi olan çiftlerin dönem kalıpları gibi faktörleri hesaba katmamasıdır.
Aksakal

Saf istatistiklerin ötesinde, diğer faktörleri düşünmeden önce matematiğe başlamadığınızı görmek güzel
TheBlastOne

8

En sevdiğim kitabın kapağı, doğumların tarihlere göre eşit bir şekilde tahsis edildiğinin varsayılmasına karşı bazı önemli kanıtlar sunar. Özellikle ABD’de 1970’li yıllardan bu yana doğanlar, birbirleriyle üst üste binmiş birkaç eğilim sergilemektedir: uzun, çok on yıllık bir eğilim, periyodik olmayan bir eğilim, haftanın günü trendleri, yılın günü trendleri, tatil trendleri (Sezaryen gibi prosedürler nedeniyle). Bu bölüm birinin doğum tarihini etkili bir şekilde planlamasına izin verir ve doktorlar çoğu zaman bunları tatillerde yapmazlar). Sonuç, bir yılda rastgele seçilen bir günde doğma olasılığının üniform olmadığı ve doğum oranının yıllar arasında değiştiği için, tüm yılların da eşit olması muhtemel değildir.

Bu aynı zamanda, Asksal’ın çözümünün çok güçlü bir rakip olsa da eksik olduğuna dair kanıtlar sunmaktadır. Buradaki oyunların etkisiyle az sayıda artık gün "kirlenecek", bu yüzden Asksal'ın tahmini de haftanın günü ve uzun vadeli eğilimlerin Şubat ayının yanı sıra uzun vadeli eğilimlerin etkisini de yakaladı. Efekt. Hangi etkileri dahil etmek uygun ve uygun değildir, sorunuzla açıkça tanımlanmamıştır

Ve bu analiz yalnızca, diğer uluslardan veya nüfustan oldukça farklı olabilecek demografik eğilimlere sahip olan ABD'yi etkiliyor. Mesela Japonya'nın doğum oranı onlarca yıldır düşüyor. Çin'in doğum oranı devlet tarafından düzenleniyor, bazı ülkelerin ulusunun cinsiyet kompozisyonu ve dolayısıyla sonraki nesillerde doğum oranları.

Aynı şekilde, Gelman'ın analizi sadece son birkaç on yıl boyunca tanımlamaktadır ve bunun, sorunuzun ilgilendiği bir dönem olduğu kesin değildir.

görüntü tanımını buraya girin

Bu tür şeyler hakkında heyecanlananlar için, kapaktaki materyal Gauss süreçleri bölümünde uzunca tartışılmaktadır.


2
Buradaki blog yazısında da kullanılan modelin kısa bir açıklaması: andrewgelman.com/2012/06/19/…
Sakari Cajanus

3

29 Şubat, her yıl 4 katı olan bir tarih .

Bununla birlikte, 100'ün katı olan ancak 400'lerden biri olmayan yıllar, artık yıllar olarak kabul edilmez (Örn: 1900, 2000 veya 1600 iken, artık bir yıl değildir). Bu nedenle, bugünlerde, her 400 yılda bir aynı modeldir.

Öyleyse matematik işlemini [0; 400 [ aralık: ] yapalım.

400 yıllık bir süre üzerinde, tam olarak orada 4 x 25 = 100 katı kadar olan yaş , 4 . Fakat 100'ü 3'ten (100'ün çarpı 100'ü, 400'ü olmayan) çıkarmamız gerekiyor ve 100 - 3 = 97 alıyoruz yıl .

Şimdi 97'yi 366 ile çarpmamız gerekiyor , 97 x 366 = 35502 (artık bir yılda 400 yıldaki bir gün sayısı), (365 x (400-97)) = 110 595 (kalan gün sayısı) t 400 yıllık bir sürede artık yılda).

Öyleyse, 400 yıllık bir süre içindeki toplam gün sayısını bilmek için bu iki sayıyı eklememiz gerekir: 110 595 + 35502 = 146 097 .

Bitirmek için olasılık, 400 yıllık bir dönemde 29 Şubat sayısıdır, bu yüzden 97 artık, aramızdaki toplam gün sayısına bölünen 97 artık yıl olması koşuluyla:

p = 97/146097 ≈ 0,0006639424492

Umarım bu doğru ve açıktır.


7
Bu, rastgele seçilen bir tarihin 29 Şubat'ta olma şansının güzel bir analizi. Bu konudaki tartışmanın çoğunun, bunun muhtemel günler kümesinden rastgele çekilişler gibi davranmayan, doğum şansı ile ilgili soruları aslında yanıtlamadığına odaklandığına inanıyorum.
whuber

1
Çok daha kolay bir yol, daha önce çalıştığınız şekilde 400 yılda 97 artık yıl olduğunu söylemek. 400 normal yıldaki gün sayısını hesaplayın. 400 * 365 = 146000. Ardından, 146097 veren 97 artık günü eklemelisiniz.
CJ Dennis

2

Burada karıştırılan iki soru olduğuna inanıyorum. Birincisi, "Herhangi bir günün 29 Şubat'ta olma olasılığı nedir?" İkincisi (ve gerçekten sorulan) "Artık bir günde doğma olasılığı nedir?"

Basit sayma günleri yaklaşımı Aksakal'ın işaret ettiği gibi yanıltıcı görünüyor. Gün sayımı ve 29 Şubat'ta meydana gelen frekansların hesaplanması şu soruyu ele alıyor: "Herhangi bir günün 29 Şubat'ta olma olasılığı nedir?" (Komadan sonra uyandığınızı, hangi gün olduğuna dair hiçbir ipucunun olmadığını düşünün. 29 Şubat'ta olma olasılığı yukarıda belirtildiği gibidir.p=971460970,00066394).

Aksakal'ın cevabını takiben, olasılık sadece doğum günleri arasındaki doğum dağılımına ilişkin deneysel çalışmalara dayanabilir. Farklı veri kümeleri farklı sonuçlara varacaktır (örneğin mevsimsellik, doğum oranlarındaki uzun vadeli eğilimler, kültürel farklılıklar nedeniyle). Aksakal bir çalışmaya işaret etti (Bir yorum: söz konusu verilerde artık yılın bir temsili olmayan oluşumunu hesaba katmak için (örn.314) uzun yıllara ait artık yıl meydana gelme sıklığına kıyasla (örneğin; 97400) 29 Şubat’taki doğum sıklığını, örneklemle çarpmanız gerekir. 97400143=6796001.131667).

Son olarak, sorulmadığını düşündüğüm üçüncü bir yorum var: “Belirli bir insanın artık bir günde doğması olasılığı nedir?” Zaten doğmuş biri için bu kolaydır. İkiside0 veya 1. Doğmamış, ancak henüz gebe kalmış biri için, hamileliğin uzunluğu ile ilgili ampirik çalışmalar kullanılarak da tahmin edilebilir ( genel bakış için Wikipedia'ya bakınız ). Henüz gebe olmayan biri için, yukarıya bakın.


2
Errr, bunu oylamaya hazırdım ve sonra zaten doğdu, herkes için kolay olan şey için aldım . Ya 0 ya da 1'dir. Hayır.
mattdm

Sanırım bu, olasılıkların yorumlanmasına biraz bağlı. Madeni parayı çevirdiğimi varsayalım. Ona baktım ve sonucu biliyorum (örneğin kafalar). Yanımda duruyorsun ama sonucu görmedin. Madalyonun kafa gösterme olasılığı nedir (benim için, "nesnel olarak" benim için)? Yukarıdaki örnekte: verilen (doğmuş) kişi için olasılık 0 veya 1'dir (hangi tarihte doğduğunu bildiği varsayılarak). Eğer rastgele birini seçerseniz ve onun doğum gününü tahmin etmeniz gerekiyorsa, 29 Şubat olma olasılığı tekrar deneysel bir sorudur.
data_enthusiast 03:16

1

Yukarıdaki cevapların çoğunun, belirli bir dönemdeki artık gün sayısını hesaplayarak bu sorunu çözdüğünü fark ettim. Tanımı gereği cevabı,% 100 doğru bir şekilde elde etmenin daha basit bir yolu var:

Artık (365 gün) takvimi ortalama tropik yıla (yani ortalama güneş yılı) ayarlamak için artık yılları kullanırız. Ortalama tropikal yıl "Güneş'in Dünya'dan görüldüğü gibi mevsim döngüsünde aynı konuma geri dönme zamanı" dır (Wikipedia). Tropikal yıl biraz değişmekle birlikte, ortalama (ortalama) tropikal yıl yaklaşık 365.24667'dir.

Artık günler doğruysa, rastgele seçilen bir günün artık gün olma şansı ((tropikal yıl) - (artık yıl)) / tropikal yıl

Elimizdeki yaklaşık sayıyı takarak, (365.24667-365) /365.24667 veya 0.24667 / 365.24667 veya milyonda 675 (% 0.0675) olur.

Ancak bu, rastgele seçilen bir gün içindir. Bunun esasen çocuklarına açıklamak istemeyecek olan ebeveynler tarafından çarpıtılmış olduğunu hayal ediyorum, “gerçek doğum günün sadece 4 yılda bir gelir”.


3
Bunun sorulan soruyu yanıtladığını sanmıyorum, çünkü artık gün 29 Şubat sadece belirli takvim sistemlerinde var. Bu takvim sistemleri son dönemlerde yalnızca belirli toplumlarda kullanılıyordu. Örneğin, bu soru hiç "Şubat" olmayan İbranice takvimi kullanarak zamanı düşünen biri için anlaşılmaz! Dahası, artık bir güne sahip bir takvimi varsaysak bile, yine de doğumların günlere göre olasılık dağılımını çevreleyen belirsizliği çözmez.
Sycorax, 22: 25’te Monica

@ user777, bu alakasız. Eğer sıçrama gün tanımadığı bir kültüre aitse, hala doğarlar bireyler olacağını bizim artık gün.
Ahtapot

1
@Octopus Gregoryen takviminin tanıtıldığı ay olan 1582 Ekim, 1582 doğumlu değillerse. Soru, hangi popülasyonların göz önünde bulundurulduğunu ayırt etmesine izin verecek kadar belirgin değil, bu yüzden yorumumun kritik bir önemi var.
Sycorax, Reinstate Monica

@ user777, saçları bölüyorsunuz. Mesele şu ki, Gregoryen takvimi bugün var ve o tarihte gözlemlemiş olsunlar olmasın tarihin her bir günü için kullanılabilir.
Ahtapot

1
@Octopus Bunun ne anlama geldiğini nereden biliyorsunuz?
Sycorax, Reinstate Monica

-4

Doğum günleri 29 Şubat olan kız kardeşime sordum ve “Kendi deneysel çalışmamın sonucu açıkçası 1.00 olduğu” dedi.


Öyle görünüyor ki, takdir edilmedi. Kayıt edilmiş.
John Smith,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.