Bugünün artık bir gün olduğu göz önüne alındığında, artık bir artık günde doğma olasılığını bilen var mı?
Bugünün artık bir gün olduğu göz önüne alındığında, artık bir artık günde doğma olasılığını bilen var mı?
Yanıtlar:
Emin. Daha ayrıntılı bir açıklama için buraya bakınız: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .
Ancak esasen yazar, “2 bin yılda 485 artık yıl var. Öyleyse, 2 bin yılda toplam gün var. bunlardan (artık yıllarda) ait 485, bu nedenle olasılığıdır 485 / 730485 = ,0006639424 "
İstatistikleri kullanarak bu olasılığı doğru bir şekilde tahmin etmek için, doğumun nerede gerçekleştiğini bilmek faydalı olacaktır.
Bu sayfa http://chmullig.com/2012/06/births-by-day-of-year/ , günlük doğum sayısının bir alt kümesini gösteren bir grafiğe sahiptir (29’u 4’le çarparak yanlış ve istenmeyen bir durumdur). Bu soru için, fakat aynı zamanda orijinal verilere de bağlanır ve ABD'de ne bekleyebileceğinize dair kabaca bir gösterge verir. Bu eğrinin diğer ülkeler için ve özellikle diğer kıtalar için geçerli olmadığını varsayacağım. Özellikle güney yarım küre ve ekvatoral bölge, iklimin belirleyici bir faktör olduğu varsayımıyla bu sonuçlardan önemli bir türev gösterebilir.
Ayrıca, “seçmeli doğum” konusu da var ( http://bmjopen.bmj.com/content/3/8/e002920.full'un yazarlarına değindi ) - dünyanın daha fakir bölgelerinde, farklı bir şey beklemekteydim doğumların dağılımı, çünkü (acil olmayan) sezaryen bölümleri veya indüklenen doğum, gelişmiş ülkelere göre daha nadirdir. Bu, doğumların son dağılımını çarpıtır.
Amerikan verilerini kullanarak, 29 Şubat'ta ~ 71 Milyon doğum (kaba ortalama * 366) ve 46.000 doğum olduğunu varsayarak, artık yılların veri dağılımındaki dağılımını düzeltmeyeceğini, kesin sürenin belirtilmediği için verip verme ihtimaline ulaşıyorum. yaklaşık ~ 0.000648. Bu, doğumların düz bir dağılımına bakıldığında beklenecek değerin biraz altında ve bu nedenle grafikte verilen genel izlenim doğrultusunda.
Motive edici bir okuyucuya bu kaba tahminin önem testini bırakacağım. Ancak, 29'unun (düzeltilmemiş olsa da - 2000 yılı verilere ortalamanın altında bir önyargı enjekte ediyor), zaten düşük Şubat standartları için bile düşük puanlar aldığına göre, eşit dağılımın sıfır-mısırhosesinin reddedileceğine dair görece yüksek bir güvence varım.
Bence bu sorunun cevabı sadece deneysel olabilir. Herhangi bir teorik cevap, doğum günü seçim olgusu, mevsimsellik vs. hesaplanmadan hatalı olacaktır. Bunların teorik olarak ele alınması imkansızdır.
Doğum günü verilerini gizlilik nedeniyle ABD'de bulmak zor. Burada anonim bir veri var . ABD'deki sigorta uygulamalarından. Bir sık kullanılan alıntı gibi diğer raporlardan farkı NYT makalesi bir yılda basit gün sıralaması yerine, doğum sıklığını tarihe göre sıralamasıdır. Zayıf nokta kuşkusuz, örnekleme yanlılığı, sigortadan geldiği için: sigortasız insanlar dahil edilmiyor vs.
Verilere göre, 29 Şubat’ta toplam 481040’ta 325 doğum vardı. Roy Murphy’ye göre, örnek 1981’den 1994’e kadar yayıldı . Herhangi bir düzeltme yapılmadan, olasılık , 29 Şubat 1981 ile 1994 arasında doğma olasılığının % 0.0675'i olacaktır.
Sen (1/4 yakındır Artık yıllarda sıklığı, hesaba katarak olasılığını ayarlayabilirsiniz tam olarak gerçi bu sayısı çarpılarak örneğin) 0.079% tahminine gelmesi. Burada, koşullu olasılığı s artık bir yıl içinde Şubat 29 doğmuş olmak gözlenen frekansına bağlı olduğu F o = 325 frekans ile f L = 3 : Bir örnekteki artık yıl arasında F o = f L / N ⋅ F ⋅ p , burada , N =
Normal olarak, artık yıl olasılığıdır , bu nedenle, uzun dönem ortalama olasılık P L Şubat 29 doğmuş olmak sahiptir: p L = p L ⋅ s ≈ s L ⋅ K
Sıçrama yılında doğmuş olmanız şartıyla 29 Şubat'ta doğmuş olmak için şartlı olasılık ile ilgilenebilirsiniz : p = N
Yani, arasındaki bağlantı , belirli bir yılda doğmuş olmak ihtimali üniforma olduğunu ve değişmediğini bazı varsayımları çift, örneğin dayanmaktadır.
Tabii ki, bu tartışma ABD merkezli idi. Diğer ülkelerdeki kalıpların ne olduğunu kim bilebilir?
GÜNCELLEME: Otomatik olarak OP'nin Gregoryen takvimi olduğunu varsaydık. Ay takvimi gibi farklı takvimler düşünürseniz daha da ilginçleşir.Artık yılların her 30 yılda bir olduğu Ayri Hicri .
GÜNCELLEME 2:
Amitabh Chandra, Harvard University
Şimdi, Gregoryen takviminde çok tuhaf günler: 1 Ocak, 25 Aralık ve Deb 29'un en popüler doğum günleri olarak rastgele gelmesi ne kadar muhtemel? Bence pek rastlantısal bir durum değil. Bu nedenle, Hicri gibi diğer takvimlerde neler olup bittiğini görmek daha da ilginç.
GÜNCELLEME 3:
GÜNCELLEME 4:
Ben Millwood, doğumların yılın gününe göre dağılımının tek tip olmadığını belirtti. Bu ifadeyi test edebilir miyiz? Veri setimi kullanarak çalıştırabiliriz Dağılımın tekdüze olduğu varsayımına dayanarak teorik dağılımın sınanması . Sonuç reddetmedir, yani dağılım tekdüze görünmez.
Teorik dağılım böyle inşa edilmiştir. Doğum sıklığının tüm takvim günleri boyunca tek tip olduğunu varsayıyoruz, yani 14 yıl boyuncagünler. Daha sonra günleri 366 olan yılın günlerine ayırıyoruz. Açıkçası sadece 3 artık gün ve 14 artık olmayan gün ile karşılaşıldı. Aşağıda benim MATLAB kodum ve teorik ve ampiriklerin karşılaştırılması için dağıtım grafiği.
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
ÇIKTI:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
En sevdiğim kitabın kapağı, doğumların tarihlere göre eşit bir şekilde tahsis edildiğinin varsayılmasına karşı bazı önemli kanıtlar sunar. Özellikle ABD’de 1970’li yıllardan bu yana doğanlar, birbirleriyle üst üste binmiş birkaç eğilim sergilemektedir: uzun, çok on yıllık bir eğilim, periyodik olmayan bir eğilim, haftanın günü trendleri, yılın günü trendleri, tatil trendleri (Sezaryen gibi prosedürler nedeniyle). Bu bölüm birinin doğum tarihini etkili bir şekilde planlamasına izin verir ve doktorlar çoğu zaman bunları tatillerde yapmazlar). Sonuç, bir yılda rastgele seçilen bir günde doğma olasılığının üniform olmadığı ve doğum oranının yıllar arasında değiştiği için, tüm yılların da eşit olması muhtemel değildir.
Bu aynı zamanda, Asksal’ın çözümünün çok güçlü bir rakip olsa da eksik olduğuna dair kanıtlar sunmaktadır. Buradaki oyunların etkisiyle az sayıda artık gün "kirlenecek", bu yüzden Asksal'ın tahmini de haftanın günü ve uzun vadeli eğilimlerin Şubat ayının yanı sıra uzun vadeli eğilimlerin etkisini de yakaladı. Efekt. Hangi etkileri dahil etmek uygun ve uygun değildir, sorunuzla açıkça tanımlanmamıştır
Ve bu analiz yalnızca, diğer uluslardan veya nüfustan oldukça farklı olabilecek demografik eğilimlere sahip olan ABD'yi etkiliyor. Mesela Japonya'nın doğum oranı onlarca yıldır düşüyor. Çin'in doğum oranı devlet tarafından düzenleniyor, bazı ülkelerin ulusunun cinsiyet kompozisyonu ve dolayısıyla sonraki nesillerde doğum oranları.
Aynı şekilde, Gelman'ın analizi sadece son birkaç on yıl boyunca tanımlamaktadır ve bunun, sorunuzun ilgilendiği bir dönem olduğu kesin değildir.
Bu tür şeyler hakkında heyecanlananlar için, kapaktaki materyal Gauss süreçleri bölümünde uzunca tartışılmaktadır.
29 Şubat, her yıl 4 katı olan bir tarih .
Bununla birlikte, 100'ün katı olan ancak 400'lerden biri olmayan yıllar, artık yıllar olarak kabul edilmez (Örn: 1900, 2000 veya 1600 iken, artık bir yıl değildir). Bu nedenle, bugünlerde, her 400 yılda bir aynı modeldir.
Öyleyse matematik işlemini [0; 400 [ aralık: ] yapalım.
400 yıllık bir süre üzerinde, tam olarak orada 4 x 25 = 100 katı kadar olan yaş , 4 . Fakat 100'ü 3'ten (100'ün çarpı 100'ü, 400'ü olmayan) çıkarmamız gerekiyor ve 100 - 3 = 97 alıyoruz yıl .
Şimdi 97'yi 366 ile çarpmamız gerekiyor , 97 x 366 = 35502 (artık bir yılda 400 yıldaki bir gün sayısı), (365 x (400-97)) = 110 595 (kalan gün sayısı) t 400 yıllık bir sürede artık yılda).
Öyleyse, 400 yıllık bir süre içindeki toplam gün sayısını bilmek için bu iki sayıyı eklememiz gerekir: 110 595 + 35502 = 146 097 .
Bitirmek için olasılık, 400 yıllık bir dönemde 29 Şubat sayısıdır, bu yüzden 97 artık, aramızdaki toplam gün sayısına bölünen 97 artık yıl olması koşuluyla:
p = 97/146097 ≈ 0,0006639424492
Umarım bu doğru ve açıktır.
Burada karıştırılan iki soru olduğuna inanıyorum. Birincisi, "Herhangi bir günün 29 Şubat'ta olma olasılığı nedir?" İkincisi (ve gerçekten sorulan) "Artık bir günde doğma olasılığı nedir?"
Basit sayma günleri yaklaşımı Aksakal'ın işaret ettiği gibi yanıltıcı görünüyor. Gün sayımı ve 29 Şubat'ta meydana gelen frekansların hesaplanması şu soruyu ele alıyor: "Herhangi bir günün 29 Şubat'ta olma olasılığı nedir?" (Komadan sonra uyandığınızı, hangi gün olduğuna dair hiçbir ipucunun olmadığını düşünün. 29 Şubat'ta olma olasılığı yukarıda belirtildiği gibidir.).
Aksakal'ın cevabını takiben, olasılık sadece doğum günleri arasındaki doğum dağılımına ilişkin deneysel çalışmalara dayanabilir. Farklı veri kümeleri farklı sonuçlara varacaktır (örneğin mevsimsellik, doğum oranlarındaki uzun vadeli eğilimler, kültürel farklılıklar nedeniyle). Aksakal bir çalışmaya işaret etti (Bir yorum: söz konusu verilerde artık yılın bir temsili olmayan oluşumunu hesaba katmak için (örn.) uzun yıllara ait artık yıl meydana gelme sıklığına kıyasla (örneğin; ) 29 Şubat’taki doğum sıklığını, örneklemle çarpmanız gerekir. ).
Son olarak, sorulmadığını düşündüğüm üçüncü bir yorum var: “Belirli bir insanın artık bir günde doğması olasılığı nedir?” Zaten doğmuş biri için bu kolaydır. İkiside veya . Doğmamış, ancak henüz gebe kalmış biri için, hamileliğin uzunluğu ile ilgili ampirik çalışmalar kullanılarak da tahmin edilebilir ( genel bakış için Wikipedia'ya bakınız ). Henüz gebe olmayan biri için, yukarıya bakın.
Yukarıdaki cevapların çoğunun, belirli bir dönemdeki artık gün sayısını hesaplayarak bu sorunu çözdüğünü fark ettim. Tanımı gereği cevabı,% 100 doğru bir şekilde elde etmenin daha basit bir yolu var:
Artık (365 gün) takvimi ortalama tropik yıla (yani ortalama güneş yılı) ayarlamak için artık yılları kullanırız. Ortalama tropikal yıl "Güneş'in Dünya'dan görüldüğü gibi mevsim döngüsünde aynı konuma geri dönme zamanı" dır (Wikipedia). Tropikal yıl biraz değişmekle birlikte, ortalama (ortalama) tropikal yıl yaklaşık 365.24667'dir.
Artık günler doğruysa, rastgele seçilen bir günün artık gün olma şansı ((tropikal yıl) - (artık yıl)) / tropikal yıl
Elimizdeki yaklaşık sayıyı takarak, (365.24667-365) /365.24667 veya 0.24667 / 365.24667 veya milyonda 675 (% 0.0675) olur.
Ancak bu, rastgele seçilen bir gün içindir. Bunun esasen çocuklarına açıklamak istemeyecek olan ebeveynler tarafından çarpıtılmış olduğunu hayal ediyorum, “gerçek doğum günün sadece 4 yılda bir gelir”.
Doğum günleri 29 Şubat olan kız kardeşime sordum ve “Kendi deneysel çalışmamın sonucu açıkçası 1.00 olduğu” dedi.