Birden çok çarpışmada ters doğum günü sorunu


9

Uzunluğu bilinmeyen bir uzaylı yılı geçirdiğinizi varsayalım. Söz konusu uzaylıların rastgele bir örneğine sahipseniz ve bazıları doğum günlerini paylaşıyorsa, bu verileri yılın uzunluğunu tahmin etmek için kullanabilir misiniz?

Örneğin, 100'lük bir örnekte, iki üçüz (yani her biri üç uzaylı tarafından paylaşılan iki doğum günü) ve beş çift ve seksen dört tektonunuz olabilir. N'yi tahmin ederken, mutlak minimum 91 ve maksimum sınırsızdır, ancak makul bir beklenen değeri nasıl bulabilirim?

Varsayımlar, "tüm doğum günleri eşit derecede olasıdır" gibi şeyleri içerir.

Burada cevaplanan başka bir sorunun aksine, odada bilinen çarpışmalar var. Yeterince uzun bir yıl, bir uzaylı odası için çarpışma olmayacak güçlü bir ihtimal olacaktır. Ancak çok uzun yıllar herhangi bir çarpışma olasılığını düşük tutacaktır ve kısa yıllar az sayıda çarpışma olasılığını düşük tutacaktır, böylece en muhtemel yıl uzunlukları için (teorik) bir aralık sağlayacaktır.


3
Bu sorunun özel bir sürümüne cevabım kolayca genelleşiyor (çok terimli dağıtımı kullanarak): bkz. Stats.stackexchange.com/questions/252813 .
whuber

@Techhead Çeşitli şekillerde! Söz konusu parametre kestirimi için açık yaklaşım maksimum olasılık olacaktır.
Glen_b


1
@whuber Bu soruyu ve yorumunuzu gördüm, ancak çoğunun bilinen çarpışmalara sahip bir örneğe nasıl uygulanacağını görmedim. Genişletilmiş formu bulmak zor değil, ama logaritmik toplamı nasıl bulacağımı bilmiyorum.
Techhead

1
Sürümünüzün, kopya olarak kapatılmaması gerektiğinden yeterince daha karmaşık olduğunu kabul ediyorum.
whuber

Yanıtlar:


2

Bir dağılımın beklenti değeri şu şekilde hesaplanır: E(X)=pixi. Bu sorun için,N bazı çarpışma kriterleri verildi veya E(N)=n=0pnn bazı çarpışma kriterleri verildiğinde, pn=P(N=n).

Yukarıda belirtildiği gibi bazı çarpışma kriterleriniz olduğunu varsayalım ve qn yılın uzunluğu göz önüne alındığında çarpışma kriterlerinin karşılanma olasılığı n. Sonra qnÇarpışma kriterlerinin karşılanma yollarının sayısını, doğum günlerinin genel olarak düzenlenebilme yollarına bölerek bulunabilir. bir Zamanlarqn mümkün olan her biri için bulunur n, o zaman eksik olan tek parça çeviri qn için pn.

Eğer varsayarsak pn Orantılıdır qn, sonra pn=αqn. Dan beri n=0pn=1, αn=0qn=1 ve α=1n=0qn. Bu nedenle, sadece qn bu problemi çözmek için.

Örneğiniz için, önce çarpışma ölçütlerinin verilebileceği yol sayısını bulalım N=n. İlk yabancı single herhangi bir günde inebilir, bu yüzden nolasılık. Bir sonraki singleton herhangi bir güne inebilir, ancak ilk uzaylıların doğum günü, bu yüzdenn1olasılık. Bunu ilk 84 singleton için tamamlıyoruzn(n1)(n2)...(n83)bunun olası yolları. Ayrıca 5 çift ve 2 üçüzümüz olduğuna dikkat edin, bu nedenle her grup için "ilk" uzaylı tekil çiftlere de inmemelidir. Bu birn(n1)(n2)...(n8452+1) Bu uzaylılar çarpışmasın yolları (beceriksiz sözdizimi daha sonra daha kolay genelleme içindir).

Daha sonra, belirli bir çift veya üçüz için ikinci uzaylı 91 seçeneğe, bir sonraki 90'a vb. 91(911)(912)...(917+1). Üçüzlerin geri kalan üyeleri çiftlerin doğum günlerine düşmelidir ve bunun olasılığı76. Çarpışma kriterlerinin karşılanması için toplam olası yol sayısını elde etmek için bunların hepsini bir araya getiriyoruz:

rn=n(n1)...(n8452+1)(84+5+2)(84+5+21)...(84+1)(5+2)(5+1)

Bu noktada, model açıksa, a singletonların, b çiftler ve c üçüz, 84 yerine a, 5 ile b, ve 2 ile cgenelleştirilmiş bir formül elde etmek için. Genel olarak doğum günleri için olası yolların sayısının danm, burada m problemdeki toplam uzaylı sayısıdır. Bu nedenle, çarpışma kriterlerini karşılama olasılığı, çarpışma kriterlerini karşılamanın yollarının, uzaylıların doğma yollarının sayısına bölünmesi veyaqn=rnnm.

Formülünde ilginç bir şey daha ortaya çıktı rn. İzin Vermekyn=n(n1)...(n(a+b+c)+1)=n!(n(a+b+c))!ve bırak zn kalan kısmı olmak rn Böylece rn=ynzn. Bunu not etzn n'den bağımsızdır, bu yüzden yazabiliriz zn=zsabit olarak! Dan beripn=qn/i=0qi, ve qn=zynnm, aslında zpaydadaki toplamın dışında. Bu noktada, almak için paydan bölümü ile iptal ederpn=ynnm/i=0(yiim). Basitleştirebilirizyn daha fazla izin verirsek s=a+b+c (veya bu, uzaylı grubundaki benzersiz doğum günlerinin sayısı olarak düşünülebilir), böylece:

pn=n!(ns)!nm/i=0(i!(is)!im)

Şimdi (oldukça) basit bir formülümüz var. pnve bu nedenle (oldukça) basit bir formül E(N)yapılan tek varsayım, P(N=n) Orantılıdır qn (verilen çarpışma kriterlerini karşılama olasılığı N=n). Bunun adil bir varsayım olduğunu düşünüyorum ve benden daha akıllı biri, bu varsayımın ilişkili olduğunu kanıtlayabilir.P(N=n)multinom dağılımını takiben. Bu noktada hesaplayabilirizE(N) gibi sayısal yöntemler kullanarak veya bazı varsayımlarda bulunmak pn 0'a yaklaşacak n yaklaşımlar .


Beklenti değerini, olasılık kitle işlevinden ziyade bir olasılık işlevine göre hesaplamayı öneriyormuşsunuz gibi görünüyor. Bu kasıtlı mıydı?
Sextus Empiricus

2

Cody'nin mükemmel cevabı, olasılık fonksiyonunu ifade etmek için güzel bir yol sunuyor. N, olasılıktan bağımsız olan bir kısmı hesaba katarak, yılın gün sayısı (veya bir önceki daireye dayalı posterior dağılım) N.

Bu cevapta daha kısaca yazmak ve aynı zamanda bu olasılık fonksiyonunun maksimumunu hesaplamak için bir yol sağlamak istiyorum (hesaplanması çok daha zor olan beklenen değerden ziyade).


N için olabilirlik fonksiyonu

Bir dizi çizmenin yol sayısı a+2b+3c bir dizi doğum günü n doğum günleri, a tek doğum günü sayısı, b yinelenen doğum günleri ve c üçlü doğum günleri eşittir

rn=(na+b+c)number of ways topick m unique birthdaysout of n days(a+b+c)!a!b!c!number of ways todistribute m birthdaysamong groups of size ab and c(a+2b+3c)!1!a2!b3!cnumber of ordered ways toarrange specific single, duplicate, and triplicatesamong the aliens =n!(nabc)!×(a+2b+3c)a!b!c!1!a2!b3!c

ve yalnızca sağ taraftaki ilk terim n, diğer terimleri hesaba katarak, bir olasılık işlevi için basit bir ifadeyle bitiririz

L(n|a,b,c)=n(a+2b+3c)n!(nabc)!=nmn!(ns)!P(a,b,c|n)

Cody'nin notasyonunu takip edip m Yabancıların sayısını belirtmek ve s benzersiz doğum günü sayısı.


N için maksimum olabilirlik tahmini

Bu olabilirlik fonksiyonunu, maksimum olabilirlik tahminini elde etmek için kullanabiliriz. N.

Bunu not et

L(n)=L(n1)(n1n)mnns

ve maksimum değer, n hangisi için

(n1n)mnns=1

veya

s=n(1(11/n)m)

hangisi için n yaklaşık olarak (yerine koyarak bulabileceğiniz bir Laurent serisi kullanarak) x=1/n ve Taylor serisini x noktada x=0)

sk=0l(mk)(n)k+O(n(l+1))

Yalnızca ilk sipariş terimini kullanma smm(m1)2n olsun:

n1(m2)ms

İkinci dereceden terimi de kullanmak smm(m1)2n+m(m1)(m2)6n2 olsun:

n2(m2)+(m2)24(ms)(m3)2(ms)

Yani m=100 aralarında olan yabancılar s=91 Yaklaşımı kullanarak benzersiz doğum günleri n1550 ve n2515.1215. Denklemi sayısal olarak çözdüğünüzde,n=516.82 hangi biz yuvarlanır n=516 MLE almak için.

gerçek MLE ile yaklaşımı karşılaştırma

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.