Lütfen bekleme paradoksunu açıklayın


75

Birkaç yıl önce olaylar arasındaki süreyi ölçmek yerine saymak yerine çalışan bir radyasyon dedektörü tasarladım. Benim tahminime göre, bitişik olmayan örnekleri ölçerken, ortalama olarak gerçek aralığın yarısını ölçeceğim. Ancak devreyi kalibre edilmiş bir kaynakla test ettiğimde okuma, iki aralığın çok yüksek olduğu ve tüm aralığı ölçtüğüm anlamına geliyordu.

Olasılık ve istatistik üzerine eski bir kitapta "Bekleyen Paradoks" adlı bir bölüm hakkında bir bölüm buldum. Her 15 dakikada bir otobüs durağına bir yolcunun ulaştığı ve bir yolcunun rastgele geldiği bir örnek sundu, yolcunun ortalama 15 dakikayı bekleyeceğini belirtti. Örnekle sunulan matematiği hiçbir zaman anlayamadım ve bir açıklama aramaya devam etmedim. Birisi bunun neden böyle olduğunu açıklayabilirse, yolcu tam aralığı bekler, daha iyi uyuyacağım.


1
Kitabın adı nedir ve kitabın yazarı kimdir? Buradaki kelime için örnek kelimeyi kopyalayabilir misiniz?
Joel Reyes Noche

Bu benim uzmanlık alanım değil, OP tarafından belirtilen paradoks , denetim paradoksu ile aynı mı?
Joel Reyes Noche


1
Görünüşe göre yukarıdaki tahminimde biraz destek var. Bu cevaba yapılan yorum , denetim paradoksundan bahseder.
Joel Reyes Noche

2
Ben otobüs analoji olarak kafa karıştırıcı olduğunu düşünüyorum, çünkü otobüs programları takip etme eğilimindedir. Ortalama bir 15 dakikada bir geldiğinde boş bir taksinin ne kadar süreceğini düşünün.
Harvey Motulsky

Yanıtlar:


48

Glen_b'in belirttiği gibi, herhangi bir belirsizlik olmadan otobüsler her dakikada bir gelirse , mümkün olan maksimum bekleme süresinin dakika olduğunu biliyoruz . Bizim tarafımızdan "rastgele" ulaşırsak, "ortalamada" mümkün olan maksimum bekleme süresinin yarısını bekleyeceğimizi hissediyoruz . Ve burada mümkün olan maksimum bekleme süresi ardışık iki varış arasındaki mümkün olan maksimum uzunluğa eşittir. Bekleme süremizi ve arka arkaya gelen iki otobüs durağı arasındaki maksimum uzunluğu belirtiriz ve1515WR

(1)E(W)=12R=152=7.5

ve biz haklıyız.

Ancak aniden kesinlik bizden uzaklaştırıldı ve dakikaya şu anda iki otobüs geldiğinde ortalama uzunluk olduğu söylendi . Ve "sezgisel düşünme tuzağına" düşüyoruz ve şöyle düşünüyoruz: " sadece beklenen değeri ile değiştirmeliyiz " ve tartışıyoruz15R

(2)E(W)=12E(R)=152=7.5WRONG

Yanlış olan bir ilk göstergesi, yani olduğu değil "herhangi iki ardışık otobüs gelenler arasındaki uzunluk", bu "dir maksimum vb uzunluk". Yani her durumda, bizde .RE(R)15

denklemine nasıl ulaştık ? "Bekleme süresi en fazla - olabilir . Her durumda eşit olasılıkla geliyorum, bu yüzden rastgele ve eşit olasılıkla mümkün olan tüm bekleme sürelerini" seçiyorum ". Bu nedenle iki ardışık otobüs varış noktası arasındaki maksimum uzunluğun yarısı benim ortalama bekleme süresi ". Ve biz haklıyız.(1)015

Fakat yanlışlıkla değerini denklem ekleyerek, davranışımızı yansıtmamaktadır. İle yerine , denklem "Tüm olası bekleme süreleri rastgele ve eşit olasılıkla seçim diyor arka arkaya iki otobüs gelenler arasındaki ortalama uzunluğuna küçük veya eşit olduğu yerde bizim sezgisel burada" -ve bizim davranış değiştirme olmadı, çünkü hata, yalan - olduğu "tüm olası bekleme sürelerini" ama - yani, düzgün rastgele gelmeden, biz gerçekte hala mümkün olan tüm bekleme süreleri "rastgele ve eşit olasılıkla seçim" değil tarafından yakalanan15(2)15E(R)(2)15 - arka arkaya iki otobüs varış yeri arasındaki uzunluk dağılımının doğru kuyruğunu unuttuk.

Yani, art arda iki otobüs gelmesi arasındaki maksimum uzunluğun beklenen değerini hesaplamalıyız, bu doğru çözüm mü?

Evet olabilir, ancak : belirli "paradoks" belirli bir stokastik varsayımla el ele gider: otobüs girişleri, Poisson süreci karşılaştırması ile modellenmiştir, bunun bir sonucu olarak, bunun arasındaki sürenin uzun olduğunu varsayıyoruz. arka arkaya gelen iki otobüs varış yeri, bir Exponential dağılımını izler. Ifade o uzunluğa ve biz buna sahip

f()=λeλ,λ=1/15,E()=15

Üstel dağılım, üstel dağılımın sağdan sınırsız desteğe sahip olması nedeniyle, elbette bu yaklaşık bir değerdir, yani "olası tüm bekleme sürelerinin" kesinlikle söylenmesi, bu modelleme varsayımı altında, "sonsuzluk" dahil olmak üzere "büyüklük ve büyüklükler" anlamına gelir; .

Ama bekleyin, Üstel olduğu belleksiz : zaman içinde hangi noktada olursa olsun biz gelecek, biz aynı rasgele değişkeni karşıya bakılmaksızın önce gitti ne.

Bu stokastik / dağıtım varsayımı göz önüne alındığında , zamanın herhangi bir noktası , uzunluğu beklenen değerle aynı olasılık dağılımı (maksimum değer değil) ile açıklanan "ardışık iki otobüs geleneği arasındaki sürenin " bir parçasıdır. : "Ben buradayım. otobüsle gelenler arasında bir aralıkla çevrili, uzunluğunun bir kısmı geçmişte, bir kısmı ise gelecekte yatar ama ne kadar ve ne kadar olduğunu bilmenin hiçbir yolu yoktur, bu yüzden yapabileceğim en iyi şey ne kadar beklediğimi sormaktır - ortalama bekleme sürem hangisi? " - Ve cevap her zaman " " dir, ne yazık ki. 1515


+1 Çok hoş. belki de okumalısınız ? f λ ( )f()fλ()
amip

Teşekkürler. Gösterime gelince, her ikisi de farklı şeyleri belirtmek için kullanılır. , rastgele değişken yoğunluğu olan stres çizgileri boyunca, çünkü çeşitli dönüşümlerde gibi bir . Önerdiğin şey yoğunluğun parametreli halini vurgulamak. fX(y)
Alecos Papadopoulos

80

Otobüs "her 15 dakikada bir" (yani bir programa göre) gelirse, o zaman (rastgele gelen) yolcunun ortalama beklemesi aslında sadece 7.5 dakikadır, çünkü o 15 dakikalık aralıkta eşit bir şekilde dağıtılacaktır.

-

Öte yandan, otobüs saatte ortalama 4 oranında (yani Poisson işlemine göre) rasgele gelirse, ortalama bekleme çok daha uzundur; Gerçekten de hafıza özelliği olmadığı için bunu çözebilirsiniz. Yolcunun gelişini başlangıç ​​olarak kabul edin ve bir sonraki etkinliğe kadar olan süre ortalama 15 dakika kadar artar.

Ayrık bir zaman benzetmesi yapmama izin verin. Biri "B" (otobüs için) ve 14'ü "X" olarak etiketlenmiş olan ve o otobüsün toplam yokluğu için (B: 30 taraflı zar var. 30 taraflı yüzler "B" ölür). Böylece dakikada bir kez otobüs gelip gelmediğine bakarım. Ölümün hafızası yok; son "B" den bu yana kaç rulo olduğunu bilmiyor. Şimdi, bağlantısız bir olay olduğunu hayal edin - bir köpek kabarır, bir yolcu gelir, bir gök gürültüsü sesi duydum. Bundan sonra, bir sonraki "B" ye kadar ne kadar bekleyeceğim (kaç rulo)?

Bellek yetersizliğinden dolayı, ortalama olarak, ardışık iki "B" arasındaki zamanla bir sonraki "B" için aynı zamanı bekliyorum.

[Sonra, 60 taraflı bir kalıbım olduğunu hayal edin on beş saniyede bir yuvarladım (yine bir "B" yüzü var); Şimdi her 1000 saniyelik bir zar attığımı ve her 0.9 saniyede bir yuvarladığımı (bir "B" yüzüyle veya daha gerçekçi bir şekilde, her üç 10 taraflı zardan birini ve her üçünde de "10" geldiğinde sonucu "B" olarak adlandırdığımı hayal edin. aynı zamanda) ... vb. Sınırda, sürekli zaman Poisson sürecini alıyoruz.]

Buna bakmanın başka bir yolu şudur: “saymaya başla rulolarımı” (yani 'yolcu otobüs durağına varıyor') olayımı, kısa bir süreden daha uzun bir aralıkta, sadece doğru şekilde yapmak için gözlemleme ihtimalim daha yüksek ortalama bekleme, otobüsler arasındaki ortalama süreyle aynıdır (çoğunlukla uzun aralıklarla bekliyorum ve çoğunlukla en kısa süreleri özlüyorum; üniform bir şekilde dağılmış bir zamanda geldiğim için, uzunluğundaki bir boşluğa ulaşma şansım orantılıdır). )ttt

Deneyimli bir otobüs avcısı olarak, uygulamada gerçeklik, 'otobüsler bir programa varıyor' ve 'otobüsler rastgele ulaşıyor' arasında bir yerde duruyor gibi görünüyor. Ve bazen (kötü trafikte), bir saat bekler, sonra 3 aynı anda gelir (Zach, bunun nedenini aşağıdaki yorumlarda tanımlar).


6
Özellikle otobüslerde, yolcuların tıkanarak geç bir otobüse geçeceği ve arkasındaki boş otobüsü sonunda yakaladığı (ancak boş kaldığı) ek bir süreç olduğunu düşünüyorum. = D
Zach

4
Gerçekten, @Zach, bu yüzden özellikle yoğun trafikte uzun vadede yığılma eğilimindedirler. Otobüs çok geç saatlerde yaşadığım yerde, bir sonrakinin zamanı geldi, bazen rota boyunca neredeyse tam zamanında olan ek bir otobüs ekleyecekler (yani, bir otobüsün çok geride kalmayacağı bir yolcu götürmeyecekler) Takvimi sık sık oraya daha hızlı bir yoldan ulaştırın) ve otobüsün şimdi sadece biraz geç kaldığı yolcuları almaya başlayın. Bu arada, çok geç otobüs şimdi programdaki bir sonraki otobüsle etkinleşiyor , diğer otobüsün geldiği yere
varıyor

@Glen_b Bu gerçekten iyi bir fikir, hah!
Zach,

Yararlı bir topaklanma stratejisidir (en azından en kötü durumları hafifletir); Daha fazla beklemedim, çünkü daha doğru otobüs bekleme süresi modellerinin başa çıkması gerekebilecek bağımlılık sorunlarıyla ilgili.
Glen_b

10

Otobüslerle ilgili daha fazla… Sohbete bu kadar geç kaldığım için sohbete kestiğim için üzgünüm, ama son zamanlarda Poisson süreçlerine bakıyorum ... Aklımdan çıkmadan önce, işte inceleme paradoksunun resimli bir temsili :

Hatalılık, otobüslerin belirli bir varış arası ortalama süre ile belirli bir varış düzenini takip ettiğinden (Poisson oranı parametresinin , bunun yerine dakika diyelim) . ), herhangi bir rasgele zamanda otobüs istasyonunda göstererek, aslında bir otobüs alıyorsunuz. Otobüs istasyonuna rastgele zamanlarda gelirseniz, bir ay boyunca bekleme sürelerinin günlük kaydını tutarsanız, aslında otobüslerin ortalama varışlar arası zamanını verir. Ama yapacağın şey bu değil.θ = 1 / λ = 15λθ=1/λ=15

Eğer bir merkezde olsaydık ve tüm otobüsleri bir ekranda görebilseydik, rastgele birden fazla otobüs alıp, arkadan gelen otobüse olan mesafeyi ortalama olarak almanın ortalama varış zamanı üreteceği doğru olurdu:

görüntü tanımını buraya girin

Ancak, bunun yerine yaptığımız şey sadece otobüs istasyonunda görünmekse (bir otobüs seçmek yerine), tipik bir sabah saatlerinde otobüs tarifesinin zaman çizelgesi boyunca rastgele bir zaman kesiti yapıyoruz. Otobüs durağında görünmeye karar verdiğimiz zaman, zamanın "oku" boyunca eşit olarak dağıtılabilir. Bununla birlikte, birbirinden daha fazla yayılmış olan otobüsler arasında daha uzun zaman boşlukları olduğu için, bu "straggler" ları aşırı örnekleme ihtimalimiz daha yüksektir:

görüntü tanımını buraya girin

... ve dolayısıyla, bekleme süresi kayıt defterimiz varışlar arası saati yansıtmayacaktır. Bu muayene paradoksu.

OP hakkında beklenen bekleme süresine ilişkin asıl soruya gelince , akıllara durgunluk veren açıklama, dakikalar içinde bıraktığımız son veri yolundan geçen zaman aralığını geçen Poisson sürecinin hafızasında kalıyor konuyla ilgisiz göründüğümüz istasyon ve bir sonraki otobüsün gelmesi için beklenen süre inatla, dakika olmaya devam ediyor . Bu en iyi Glen_b'in cevabındaki zar örneğiyle ayrık zamanda (geometrik dağılım) görülür. θ = 1515θ=15

Aslında, önceki otobüsün ne kadar süre önce bırakıldığını , dk! John Tsitsiklis'in bu MIT videosunda açıkladığımız gibi, bir Poisson süreci olarak varış noktasını ne zaman önce geriye götürdüğünü görmek zorundayız :E[time waiting (future) + time to last bus departure (past)]=30


görüntü tanımını buraya girin


Hala temiz değil? - Legos ile deneyin .


Mükemmel diyagramlar
Glen_b 23

2

Poisson Süreci başına ulaşan otobüslerin beklenen bekleme sürelerini hesaplamaktan elde ettiği farklı cevapları çözen basit bir açıklama vardır, verilen ortalama interarrival süresi (bu durumda 15 dakika), bu nedenle interarrival süreleri ortalama 15 dakika ile üssel olarak belirlenir. .

Yöntem 1 ) Poisson Süreci (üstel) hafızasız olduğu için beklenen bekleme süresi 15 dakikadır.

Yöntem 2 ) Vardığınız interarrival döneminde herhangi bir zamanda varacaksınız. Bu nedenle beklenen bekleme süresi, bu interarrival süresinin beklenen uzunluğunun 1 / 2'sidir. BU DOĞRUDUR ve yöntemle çelişmez (1).

(1) ve (2) ikisi de nasıl doğru olabilir? Bunun cevabı, vardığınız süre boyunca interarrival süresinin beklenen süresinin 15 dakika olmamasıdır. Aslında 30 dakika; ve 1/30 dakika 15 dakika, yani (1) ve (2) katılıyorum.

Neden vardığınız süre boyunca interarrival süresi 15 dakikaya eşit değil? Bunun nedeni, ilk önce varış zamanını "sabitleyerek", içinde bulunduğu interarrival süresinin uzun bir interarrival dönemi olması ortalamasından daha muhtemel olmasıdır. Üstel bir interarrival periyodu durumunda, matematiği dışarıya çıkarır, böylece vardığınız zamanı içeren interarrival periyodu Poisson Süreci için ortalama interarrival periyodunun iki katına çıkar.

Geldiğiniz zamanı içeren tam zamanlar arası sürenin tam dağılımının iki kat ortalama ile üssel olacağı açık değildir, ancak açıklamadan sonra neden arttığı açıktır. Anlaşılması kolay bir örnek olarak, diyelim arası zamanların olasılık 10 ile 10 dakika, olasılık ile 1/2 ile 20 dakika olduğunu varsayalım. Bu durumda, 20 dakika uzunluğundaki interarrival periyodunun 10 dakikalık uzun interarrival periyodu olarak ortaya çıkması muhtemeldir, ancak gerçekleştiğinde, iki kat daha uzun sürer. Bu nedenle, gün içindeki zaman noktalarının 2 / 3'ü interarrival süresinin 20 dakika olduğu zamanlarda olacaktır. Başka bir deyişle, önce bir zaman seçersek, o zaman içeren interardeğer zamanın ne olduğunu bilmek istiyorsak, (“günün” başlangıcında geçici etkileri göz ardı etmek o interarrival zamanının beklenen uzunluğu 16 1/3'tür. Ancak, ilk önce interarrival zamanını seçersek ve beklenen uzunluğun ne olduğunu bilmek istiyorsak, 15 dakika.

Yenilenme paradoksu, uzunluk taraflı örnekleme vb. Gibi diğer değişkenler de hemen hemen aynı şeyi ifade eder.

Örnek 1) Rasgele kullanım ömrüne sahip ancak ortalama 1000 saatlik bir ampulünüz var. Bir ampul arızalandığında, hemen başka bir ampul ile değiştirilir. Ampulü olan bir odaya girmek için bir zaman seçerseniz, ampul çalışıyor, o zaman çalışma süresi 1000 saatten daha uzun bir ortalama ömre sahip olacaktır.

Örnek 2) Belirli bir zamanda bir şantiyeye gidersek, o zaman orada çalışan bir inşaat işçisinin binadan aşağı düşmesine kadar geçen ortalama süre (çalışmaya başladıkları andan itibaren) çalışanın işleyene kadar geçen ortalama süreden daha büyüktür. (çalışmaya başladıkları andan itibaren) çalışmaya başlayan tüm işçilerden düşer. Neden, düşmek kadar kısa bir ortalama süresi olan işçilerin zaten düşmüş olmaktan (ve çalışmaya devam etmemek) ortalamanınkinden daha fazla olması nedeniyle, çalışan işçilerin düşmeden önce ortalama sürelerinden daha uzun zamanları olması.

Örnek 3) Bir şehirde rastgele bazı mütevazı insanlar seçin ve şehrin Major League beyzbol takımının ev oyunlarına (hepsi satmazlar) katıldılarsa, oyuna kaç kişinin katıldıklarını öğrenin. Ardından (biraz idealize edilmiş ancak makul olmayan varsayımlar altında), bu oyunlara ortalama katılım, tüm takımın ev oyunlarına ortalama katılımdan daha yüksek olacaktır. Neden? Düşük katılımlı oyunlardan ziyade yüksek katılımlı oyunlara katılan daha fazla insan olduğundan, düşük katılımlı oyunlardan ziyade yüksek katılımlı oyunlara katılanları seçmeniz daha olasıdır.


0

Sorulan soru, "... bir otobüs her 15 dakikada bir otobüs durağına varmakta ve bir yolcu rastgele ulaşmaktadır." Otobüs her 15 dakikada bir gelirse, rastgele değil ; 15 dakikada bir gelir, böylece doğru cevap 7.5 dakikadır. Ya kaynak yanlış bir şekilde alıntılandı ya da kaynağın yazarı özensizdi.

Diğer taraftan, radyasyon dedektörü farklı bir soruna benziyor çünkü radyasyon olayları bazı olasılıklara göre rastgele geliyor, muhtemelen ortalama bir bekleme süresi olan Poisson gibi bir şey.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.