Düğünüme kaç kişinin geleceğini hesaplamama yardım et! Her kişiye bir yüzde atayabilir ve ekleyebilir miyim?


37

Ben düğünümü planlıyorum. Düğünüme kaç kişinin geleceğini tahmin etmek istiyorum. İnsanların bir listesini ve yüzde olarak katılma şansını yarattım. Örneğin

Dad 100% Mom 100% Bob 50% Marc 10% Jacob 25% Joseph 30%

Yüzde yaklaşık 230 kişilik bir listem var. Düğünüme kaç kişinin katılacağını nasıl tahmin edebilirim? Sadece yüzdeleri toplayıp 100'e ayırabilir miyim? Örneğin, her biri% 10 gelme şansı olan 10 kişiyi davet edersem, 1 kişiyi bekleyebilir miyim? 20 kişiyi% 50 gelme şansı ile davet edersem, 10 kişiyi bekleyebilir miyim?

GÜNCELLEME: Düğünüme 140 kişi geldi :). Aşağıda açıklanan teknikleri kullanarak yaklaşık 150 tahmin ettim. Çok perişan değil!


43
Evlendiğin kişi için bir rakam göremiyorum. Bu en önemli miktardır.
Nick Cox,

6
Tekniğini düğünüm için kullandım ve iyi çalıştı; yaklaşık 80 kişiyi öngördük ve 85 kişi aldık. E-tablonuzdaki tüm bu kişiler olduğunda, aynı e-tabloyu teşekkür notu gönderdiğiniz kişiler gibi şeyleri izlemek için de kullanabileceğinizi unutmayın.
Eric Lippert,

2
İlgili: timharford.com/2013/10/guest-list-angst-a-statistikistical- yaklaşım . Buna değer, yazarın kişisel bloguna bağlantıyı seçtim, ancak makale Financial Times'daki makalesinden.
Steve Jessop

@EricLippert Düğünüm için benzer bir şey denedim ama başarılı olamadım. Günün çok şiddetli bir fırtınası vardı ve herkes% 30'unun bir saat uzayan ya da daha fazla bir şey göstermediğini gösteriyor
OSE,

3
@NickCox Ayrıca kendilerini de unuttular.
JFA,

Yanıtlar:


32

Davet edilen kişilerin düğüne gelme kararlarının bağımsız olduğu varsayılarak, düğüne gelecek olan misafir sayısının, mutlaka aynı olasılıklara sahip olmayan Bernoulli rasgele değişkenlerinin toplamı olarak modellenebileceği varsayılmaktadır. Bu Poisson binom dağılımına karşılık gelir .

Let dışına düğün gelecek kişilerin toplam sayısına karşılık gelen rasgele değişken kişileri davet etti. Beklenen katılımcı sayısı aslında '' show-up '' olasılıklarının , yani Olasılık kütlesel fonksiyonun formu göz önüne alındığında güven aralıklarının türetilmesi kolay değildir . Bununla birlikte, Monte Carlo simülasyonlarıyla yaklaşık olarak hesaplamaları kolaydır .N p i E ( X ) = N i = 1 p i .XNpi

E(X)=i=1Npi.

Aşağıdaki şekil, katılımcıların sayısının, davet edilen 230 kişi için (solda) 10000 simülasyon senaryosuna (sağda) dayanarak düğün için dağılımına bir örnek göstermektedir. Bu simülasyonu çalıştırmak için kullanılan R kodu aşağıda gösterilmiştir; güven aralığı tahminlerini sağlar.

görüntü tanımını buraya girin

## Parameters
N      <- 230    # Number of potential guests
nb.sim <- 10000  # Number of simulations

## Create example of groups of guests with same show-up probability
set.seed(345)
tmp    <- hist(rbeta(N, 3, 2), breaks = seq(0, 1, length.out = 21))
p      <- tmp$breaks[-1]    # Group show-up probabilities
n      <- tmp$counts        # Number of person per group

## Generate number of guests by group
guest.mat <- matrix(NA, nrow = nb.sim, ncol = length(p))
for (j in 1:length(p)) {
    guest.mat[, j] <- rbinom(nb.sim, n[j], p[j])
}

## Number of guest per scenario
nb.guests <- apply(guest.mat, 1, sum)

## Result summary
par(mfrow = c(1, 2))
barplot(n, names.arg = p, xlab = "Probability group", ylab = "Group size")
hist(nb.guests, breaks = 21, probability =  TRUE, main = "", xlab = "Guests")
par(mfrow = c(1, 1))

## Theoretical mean and variance
c(sum(n * p), sum(n * p * (1-p)))
#[1] 148.8500  43.8475

## Sample mean and variance
c(mean(nb.guests), var(nb.guests))
#[1] 148.86270  43.23657

## Sample quantiles
quantile(nb.guests, probs = c(0.01, 0.05, 0.5, 0.95, 0.99))
#1%     5%    50%    95%    99% 
#133.99 138.00 149.00 160.00 164.00 

1
Vay bu harika. Bu tam olarak ne tür bir simülasyon?
Behacad

4
Bu bir Monte Carlo simülasyonu
QuantIbex

"Grup büyüklüğünü" misafir sayısına nasıl dönüştürürsünüz? Solda seninki gibi bir
figürüm var

Bu, cevapta verilen kodun 11 ila 18 satırlarında yapılır. Senaryo için j, bir binom dağılımını ve bu grubun ortaya çıkma olasılığını kullanan 20 olasılık grubunun her biri için "show-up" sayısını üretiyorum.
QuantIbex

18

Gösterildiği gibi, beklentiler sadece ekler.

Bununla birlikte, beklentiyi bilmek pek fazla işe yaramazsa, onun etrafındaki muhtemel çeşitlilikten biraz da haberdar olmanız gerekir.

Endişelenmen gereken üç şey var:

  • bireylerin beklentileri arasındaki farklılıklar (% 60'lık gelme şansı olan bir kişi aslında beklentilerini gerçekleştiremez; daima üstünde veya altındadır)

  • insanlar arasındaki bağımlılık. Her ikisine de gelebilecek çiftler, ikisine de katılır veya katılmaz. Küçük çocuklar ebeveynleri olmadan katılmazlar. Bazı durumlarda, başkalarının orada olacağını bilmeleri durumunda bazı insanlar gelmekten kaçınabilir.

  • olasılıkların tahmininde hata. Bu olasılıklar sadece tahmindir; biraz farklı tahminlerin etkisini düşünmek isteyebilirsiniz (belki de başkalarının bu rakamlara ilişkin değerlendirmeleri)

Birincisi, normal yaklaşımla veya simülasyonla hesaplamaya uygundur. İkincisi, insanlara özgü ya da bazı bağımlılıklar dağılımı düşünülerek çeşitli varsayımlar altında simüle edilebilir. (Üçüncü madde daha zordur.)


Yorumlarda takip soruları ele almak için düzenlendi:

İfadenizi doğru anlarsam, 4 kişilik aile için, her 4 kişiden birinin ya da hiçbirinin gelmemesi için% 50 şansın var. Bu kesinlikle beklenen bir 2 sayısıdır, ancak beklenti konusundaki değişkenlik hakkında bir fikir sahibi olmak istersiniz, bu durumda muhtemelen gerçek durumu 4 / 0'ın% 50'sinin% 50'sinde tutmak istersiniz.

Herkesi bağımsız gruplara ayırabilirseniz, iyi bir ilk yaklaşım (bu tür grupların çoğuyla), bağımsız gruplar arasında ortalamaları ve varyansları eklemek ve daha sonra toplamı normal olarak (belki de devamlılık düzeltmesiyle) değerlendirmek olacaktır. Daha doğru bir yaklaşım süreci simüle etmek veya tam olarak sayısal evrişim yoluyla hesaplamayı yapmak; Her iki yaklaşım da basit olmasına rağmen, bu belirli uygulama için gereksiz bir hassasiyet seviyesidir, çünkü zaten çok fazla yaklaşım katmanı vardır - bir odanın boyutlarını en yakın ayağa söylemek ve daha sonra ne kadar boyaya ihtiyacınız olduğunu hesaplamak gibi. en yakın mililitreye kadar - ek hassasiyet anlamsızdır.

Öyleyse hayal edin (basitlik için) dört grubumuz vardı:

1) A grubu (1 kişi) -% 70 katılım şansı

2) B grubu (1 kişi) -% 60 katılım hakkı

3) C grubu (4 kişilik) - 0: 0.5 4: 0.5 (eğer biri evde kalırsa, hiçbiri gelmeyecektir)

4) D grubu (2 çift) - 0: 0.4 1: 0.1 2: 0.5 (örneğin her ikisinin de% 50 şansı, artı% 10'unun şansı, örneğin diğerinin iş taahhüdü varsa veya hasta ise)

Sonra aşağıdaki araçları ve varyansları alırız:

      mean   variance
  A    0.7     0.21
  B    0.6     0.24
  C    2.0     4.0
  D    1.1     0.89

 Tot   4.4     5.34

Bu nedenle, normal bir yaklaşım bu durumda oldukça zor olacaktır, ancak 7'den fazla insanın (% 5 sırasına göre) oldukça düşük olacağını ve 6 veya daha az zamanın kabaca% 75-80'ini meydana getireceğini düşündürecektir.

[Daha doğru bir yaklaşım süreci simüle etmek olacaktır, ancak kısaltılmış örnek yerine sorunların tamamı için, muhtemelen çok fazla bir yaklaşım katmanı olduğundan, bu gerekli değildir.]


Bu tür grup bağımlılıkları içeren birleşik dağıtımınızı yaptıktan sonra, genel ortak bağımlılık kaynaklarını (şiddetli hava koşulları gibi) uygulamak isteyebilirsiniz - veya koşullara bağlı olarak, bu tür olaylara karşı basitçe güvence altına almak veya görmezden gelmek isteyebilirsiniz. .


5
Bağımlılıklardan bahsetmek için +1. Bunlar, hava ve seyahat koşulları gibi kişilerarası ilişkiler dışındaki nedenlerden kaynaklanmaktadır. Birçoğu, belirsizlik aralığını genişleten pozitif korelasyonlara neden olur. Tahminler lojistik sağlamak için kullanılacaksa (yemekler, sandalyeler, vb.), Değişimi doğru bir şekilde değerlendirmek değerlidir. Bir düğün uygulamasında eğitimli bir tahminde bulunmaktan çok daha fazlasını yapmamakla birlikte, bu istatistiksel olayları nitel olarak anlayabilmek daha iyi tahminde bulunabilmektedir.
whuber

@whuber Hava durumu gibi diğer bağımlılık kaynakları hakkında iyi bir nokta. Bazı durumlarda, bu tür şeyler bahsettiğim etkileri kolayca kaldırabilir.
Glen_b

Bağımlılığı kolayca nasıl dikkate alabilirim? Örneğin, iki çocuklu bir çift tanıyorsam ve ebeveynlerin yaklaşık% 50 gelme şansı olmasını bekliyorum. Gelirlerse çocuklarını getireceklerini biliyorum. Her bir kişiye% 50 atfetmek ve temelde 2 kişinin geldiğini varsaymak, tasarruf sağlıyor mu?
Behacad

2
@ Behacad: Belirli bir gruba sahip olanların hepsinin ya da hiçinin bir sorusu olduğunu biliyorsanız, grubun tek bir birim olarak gelme olasılığını tahmin edebilir ve gruba içindeki kişi sayısına göre ağırlık verebilirsiniz. Hata marjlarının tahminlerinize de dahil edilmesinin iyi olacağını kabul ediyorum.
Nick Stauner

Teşekkür ederim. Yüzdeleri ve bu yüzdeye sahip insan sayısını içeren küçük bir masam var ama tam olarak ne yapacağımı bilemiyorum. Eklemem gereken ne anlama geliyor? Hangi farklılıklar? (% 100 -52,% 90 -21,% 80 -34,% 70 -16,60% -32,50% -35,40% -25,30% -11,20% -22,10 -15 ,% 0 -9)
Behacad

5

(Bu konudaki önceki yorumuma aldırmadım - sadece beklentiyi başka bir şeyle karıştırdığımı fark ettim.) Esasen, ortaya çıkan kişi sayısının beklentisini bulmaya çalıştığınıza göre, gösterilen her bir kişinin olasılığını teorik olarak ekleyebilirsiniz. Bunu yapmak için.

01

Bununla birlikte, bu yalnızca size beklenen değeri verir - ileriki varsayımlar olmadan, ortaya çıkan insanların varyansı gibi şeyleri tahmin etmek zor gibi görünecektir, çünkü ortaya çıkan A kişisinin ortaya çıkmasının B kişisinden ortaya çıkmasının mutlaka bağımsız olmadığını varsaymak oldukça adildir.

Bu bir yana, burada belli belirsiz ilgili bir BBC makalesi.


Teşekkür ederim! Bu yüzden sadece onaylamak için, eğer 10 kişinin% 10 gelme şansı olduğunu düşünürsem, örneğin 1 kişinin geleceğini tahmin edebilirim.
Behacad

Teoride evet, fakat başka şeyler üzerinde herhangi bir varsayım olmadan daha faydalı bir şey (örneğin, güven aralıkları) inşa etmek zor görünüyor.

Teşekkür ederim. Güven aralıklarında nasıl ulaşabilirim?
Behacad

Bir çok sebepten dolayı tam olarak emin değilim. (Muhtemelen daha ayrıntılı bir cevap vermek için bazı şeyleri aramak için daha fazla zaman harcamak zorunda

4

Çok sayıda,% 80'i beklediğiniz gibi. Bu, teklif ettiğiniz ayrıntılı bir analizin yalnızca hesaplamalara hatalar eklediği bir durum olabilir.
Örneğin, Marc'ın potansiyel katılımı gerçekten Joseph'in 1 / 3'ü mü? Ve Joseph'in% 30'u gerçekten mi, yoksa% 25'i mi olabilir? Tüm bu analizlerden sadece% 80 daha geçerli kılan büyük sayılara ulaştığınızda işler oluyor. Ben sadece bir düğünden döndüm. 550 davet edildi. 452 katıldı. Holü planlamak ve catering ile konuşmaya başlamak için 440 ilk tahmini iyi oldu.

Tostumdan çifte bir hat sunabilir miyim? "Unutmayın, karınız mutluysa, ama mutlu değilseniz, karınız mutsuz olmaktan çok daha mutlusunuzdur, ama mutlusunuz."


Teşekkür ederim! Endişeli olan şey, insanların her yerden ve farklı mesafelerden geleceğidir. Bazıları oldukça uzak, bazıları ise caddede.
Behacad

3
Bu rakam kültüre bağlı olabilir.
Juho Kokkala

@ Juho - Bu olabilir. ABD’deyim ve son örneğimde, davetlilerin yarısı için bir hedef düğünü, yani düğün gelinin memleketi idi. Hangi kültürel farklılıkların katılımı etkileyeceğini merak ediyorum, ama haklısınız.
JTP - Monica'dan özür dileyin

4
Bu, teoride var olan ancak pratikte sıradışı görünen bir tahminci örneğidir (bu tür bir şeyi arayana kadar): herhangi bir veri setine bakıldığında, önceden belirlenmiş bir sayı döndürür (bu durumda% 80). Hesaplanması kolaydır, çok ucuzdur (veri toplama maliyetleri sıfıra düşürülebilir) ve sıfır varyansa sahiptir. Bayes (önceki bir atom için) ve kabuledilebilir. “Ayrıntılı bir analizden kaçınarak, ele alınması zor olan ve ortadan kalkmayacak olan önyargı ve tutarlılık hakkında hala sorular sormaya devam edecek.
whuber

2

Yeni evlenen bir istatistikçi olarak, JoeTaxpayer'in doğru cevabı bulduğunu söyleyeceğim. % 80 rakamı beni biraz yüksek tutuyor, ancak eğer çoğu insan yerel ise doğru olabilirdi (bizimki bir hedef düğünüydi ve% 65'e yaklaştık).

Ancak yine de, insanların katıldığı önceki olasılıklarda çok fazla değişkenlik olduğunu varsayıyorsunuz, bence gerçekten var olmaktan çok daha fazlası. Sizden aktif olarak hoşlanmayan insanları davet etmediğinizi varsayarak, kendi imkânları dahilinde olduğu için hemen hemen herkesin geleceğini ve (geniş anlamda) bir çatışma yaşamadıklarını varsaymalısınız. Katılmalarını engelleyen bir şey olacak. Seyahat etmek zorunda olanlar için, bu gerekli zaman ve parayı arttırıyor, bu yüzden gezginlerin% 30-35'i katılmayacak (mesafeye bağlı olarak). Aksi halde, olasılıkları sabit tutun (ailen ve "a-ha kadar Austin'e kadar uçmayacak, sadece onları davet etmek istiyoruz ..."). Eğlenceli bir resepsiyon alıyorsanız, özellikle açık bir barla, insanlar genellikle mecbur kalmadıkça bunu atlamazlar.

Her neyse, evlendiğin için tebrikler. Şimdi evli kalma olasılığına gelince, bu her zaman iyi bir okumadır: http://users.nber.org/~bstevens/papers/Marital_Stability.pdf

:-)


1

Tüm olasılıkları toplayın, bu sizin beklenen insan sayınızdır.

Pii1iPi1i

Elbette, birinin gelip gelmeyeceğini diğer insanların katılımına bağlı olmadığını varsayıyoruz. Bu varsayım sadece yanlıştır. Çiftleri göz önünde bulundurun, birbirleriyle çok iyi koreledirler.

2×1iPiPi


1

Düğünüm için iki liste hazırladım - katılmaları muhtemel (% 80) ve katılmayacak (% 20). Herhangi bir nedenden dolayı daha ayrıntılı bir değerlendirme ne olursa olsun, davet edilen herkesi iki gruptan birine atadım. 2 kişi tarafından kapalıydım. N = 1. Tamamen sezgisel.


Sorabilir miyim? Son katılım oranı neydi?
JTP - Monica'dan özür dileyin

% 72 evet yanıt verdi, ancak kaç gün iptal edildiğini unutuyorum.
michaelcarniol

0

Hiç kimsenin 100'le bölmek zorunda olmadığınızı belirtmediğini fark ettim. Yüzdeleriniz, Schrödinger'in kedisi gibi, bir kimsenin parçalarını alamayacağınızın anlaşılmasıyla ortaya çıkacak bir kişinin beklenen bölümleri olarak görülebilir. katılım sırasında veya katılım olmadığında, ancak her kişinin katılım durumu etkinlik anında tamamen çözülecektir.

Yüzdelerinin menzili% 0'dan (hiç kimsenin göstermediği kadar)% 100'den (tümünün gösterdiği kadar) geçtiğinden, 10 ila 20 kişiyi içeren iki örneğinizde, her birinin oranı için beklenen değeri topladınız. göstermek için kişi ve birimleri "insanlar" olan bir numara var.

QuantIbex'in mükemmel cevabındaki belirgin denklem, yüzdeleri toplamanın olaydaki beklenen insan sayısıyla sonuçlandığını, bölünme olmadığını gösteriyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.