Uçak kazaları kümesi ne kadar tuhaf?


15

Orijinal soru (25.07.2014): Haber medyasından yapılan bu alıntı mantıklı mı, yoksa son uçak kazalarının durumunu izlemek için daha iyi bir istatistiksel yol var mı?

Bununla birlikte, Barnett ayrıca Poisson dağılımı teorisine de dikkat çekiyor, bu da çökmeler arasındaki kısa aralıkların aslında uzun olanlardan daha muhtemel olduğunu ima ediyor.

Barnett, "Her yıl ortalama bir ölümcül kaza olduğunu, yani herhangi bir günde kaza olasılığının 365'te olduğunu varsayalım" diyor. "1 Ağustos'ta bir kaza meydana gelirse, bir sonraki kazanın 2 Ağustos'ta bir gün sonra meydana gelme olasılığı 1/365'dir. Ancak bir sonraki kazanın 3 Ağustos'ta gerçekleşme şansı (364/365) x (1/365) , çünkü bir sonraki kilitlenme 2 Ağustos'ta ancak 2 Ağustos'ta kilitlenme yoksa gerçekleşir. "

Barnett, "Bu mantıksız görünüyor, ancak sonuç aralıksız olarak olasılık yasalarından kaynaklanıyor." Diyor.

Kaynak: http://www.bbc.com/news/magazine-28481060

Açıklama (7/27/14): Karşı sezgisel olan (benim için) nadir olayların zaman içinde gerçekleşme eğiliminde olduğunu söylüyor. Sezgisel olarak, nadir olayların yakın zamanda gerçekleşmeyeceğini düşünürüm. Biri beni Poisson dağılımı varsayımları altındaki olaylar arasındaki zamanın teorik veya ampirik beklenen dağılımına işaret edebilir mi? (Yani, y ekseninin frekans veya olasılık ve x ekseninin günler, haftalar, aylar veya yıllar veya benzerleri şeklinde gruplandırılmış 2 ardışık olay arasındaki zaman olduğu bir histogram.) Teşekkürler.

Açıklama (7/28/14): Başlık, geniş aralıklı kazalardan daha fazla kaza kümesine sahip olmanın daha muhtemel olduğunu göstermektedir. Bunu işlevsel hale getirelim. Bir kümenin 3 uçak kazası olduğunu ve kısa bir sürenin 3 ay ve uzun bir sürenin 3 yıl olduğunu varsayalım. 3 ay içinde 3 kazanın 3 yıl içinde olduğundan daha yüksek bir olasılığın olduğunu düşünmek mantıksız görünmektedir. İlk kazayı belirli bir şekilde ele alsak bile, önümüzdeki 3 ay içinde önümüzdeki 3 yıl ile karşılaştırıldığında 2 kazanın daha meydana geleceğini düşünmek mantıksızdır. Bu doğruysa, haber medyası başlığı yanıltıcı ve yanlıştır. Bir şey mi kaçırıyorum?


1
Açıklığa kavuşun: Olasılık , birim zaman başına olasılık ve beklenti arasında ayrım yapmayı yararlı bulabilirsiniz . Nadir olayları tanımlayan süreçler - pratik olarak "nadir" anlamıyla - olaylar arasında uzun bir beklenen süreye sahip olsa da , bu başlangıçta birim zaman başına en büyük olasılıkla tutarsız değildir . Bununla birlikte, olayın kısa bir süre içinde meydana gelme olasılığı çok düşük olacaktır.
whuber

2
Ayrıca, bu Wikipedia makalesini fark ettim - beğenebilirsin. Oh, ve ben sadece bu pdf rastlamak - özellikle uçak kazaları "kümeleme" bahseder (ve sorunu şimdiye kadar olduğundan daha iyi açıklar ...).
Steve S

1
@Glen_b: Gazete makalesindeki kusur (makalenin başlığında ima edilen, bu benim yayınımın başlığı), makalenin belirli bir sayıda (yani bir küme) meydana gelen kaza olasılığının daha yüksek olduğunu gösteriyor daha uzun bir süreden daha kısa bir süre. Bu sadece yanlış.
Joel W.29

1
@JoelW .: Eğer bir şey varsa, berbat olan gazeteci olurdu ... Her neyse, her şey temizlendi mi ya da hala rezervasyonunuz kaldı mı?
Steve S

1
Tahminimce gazeteciyi yanlış yönlendiren istatistikçi oldu. Gazetecinin kendi başına yanlış anladığından şüpheliyim (çünkü çok sezgiseldir).
Joel W.30

Yanıtlar:


3

Özet: Alıntılanan BBC paragrafındaki ilk cümle özensiz ve yanıltıcıdır.

Önceki cevaplar ve yorumlar zaten mükemmel bir tartışma sağlasa da, ana sorunun tatmin edici bir şekilde cevaplanmadığını hissediyorum.

Yani bize herhangi bir gün bir uçak kazasında bir olasılık olduğunu varsayalım ve çöker birbirinden bağımsız olduğunu. Ayrıca 1 Ocak'ta bir uçağın düştüğünü varsayalım. Bir sonraki uçak ne zaman düşecek?p=1/365

Basit bir simülasyon yapalım: önümüzdeki üç yıl için her gün için başka bir uçağın olasılık ile düşüp düşmeyeceğine rastgele karar vereceğim ve bir sonraki kazanın gününü not edeceğim ; Bu prosedürü tekrarlayacağım 100p kez. Ortaya çıkan histogram:100000

Düzlem ezilme dağılımı, bir model

Aslında, olasılık dağılımı basitçe , burada t gün sayısıdır. Bu teorik dağılımı kırmızı bir çizgi olarak çizdim ve Monte Carlo histogramına iyi uyduğunu görebilirsiniz. Not: eğer zaman daha küçük ve daha küçük bidonlarda ayrık olsaydı, bu dağılımlar üstel olana yakınlaşırdı; ama bu tartışma için gerçekten önemli değil.Pr(t)=(1p)tpt

Burada birçok kişinin belirttiği gibi, bu azalan bir eğridir. Bu, bir sonraki uçağın ertesi gün, 2 Ocak'ta düşme olasılığının, bir sonraki uçağın, başka bir günde, örneğin gelecek 2 Ocak'ta, düşme olasılığından daha yüksek olduğu anlamına gelir (fark neredeyse üç kattır: ve 0.10 % ).0.27%0.10%

0.8%94% Bu nedenle, monoton olarak azalan bir olasılık dağılımında bile, "kümelerin" (örneğin, üç günde iki uçak kazası) çok düşük bir ihtimal olması muhtemeldir.

İşte bu noktayı gerçekten aşmak için başka bir histogram. Kesişen olmayan birkaç zaman diliminde önceki histogramın toplamıdır:

Düzlemin histogramı frekansı eziyor


MIT profesörünün yanlış olduğunu mu söylüyorsunuz?
Steve S

1
Hayır, BBC makalesinde Barnett'den alıntı tamamen doğrudur. Ancak BBC muhabiri tarafından yorumlanması en iyi ihtimalle özensizdir : "Barnett, Poisson dağılımı teorisine de dikkat çekiyor, bu da çökmeler arasındaki kısa aralıkların aslında uzun olanlardan daha olası olduğunu gösteriyor" . Bu cümlenin en doğal yorumu ölü yanlıştır (ve sanırım Barnett bunu ima etmek anlamına gelmiyordu). Belki cevabımda bu konuda daha açık olmalıyım. Cevabımın katılmadığı önemli bir kısmı var mı? Umarım seninkine tamamen katılıyorum.
amip diyor Reinstate Monica

13

Muhabirin söylediği şey, bir uçak kazasının rastgele meydana gelmesinin, bir (küçük) aralıkta meydana gelen bir olayın olasılığının, söz konusu aralığın uzunluğu ve her bir olayın uzunluğu ile orantılı olduğu bir Poisson süreci olarak modellenebileceğidir. yılında Bağımsız bütün diğerlerinin.

Bu tarif edilen senaryo için makul bir model midir?

Muhtemelen.

Elbette, bu pilotlar % 100 Bağımsız olmayabilir çünkü diğer pilotlar bir çarpışmadan sonra davranışlarını büyük olasılıkla değiştirirler (sadece çok azsa). [Bilmiyorum - belki birkaç pilot biraz fazla simülatör eğitimi ya da bunun gibi bir şey yapar]. Bununla birlikte, Bağımsızlık varsayımı hala tamamen mantıklıdır.

Uçak kazası kümeleri ne olacak?

Evet. Bir Poisson süreci (hatta diğer bazı rasgele süreç) göz önüne alındığında, olur olaylardan bazı kümeleri görmeyi bekler.

Aslında, Oxford İstatistik Sözlüğü tarafından Poisson Süreci'ne girişinde ("rasgeleliğin matematiksel bir tanımı") açıklandığı gibi :

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

Örneğin, bu basit R kodu bitine göz atın :

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

hangi üretir:
Topaklanmaya dikkat edin?

Biz bile biliyorum bu rastgele noktaların bir komplo, bir anlamda görünüyor bazıları var gibi olmayan buna -rasgele bitleri - diğer parçalar ardına kadar açık iken özellikle grafiğin bazı bölümlerinde noktalarının yığınları vardır. Makalenin anlatmaya çalıştığı aynı davranış biçimidir (sadece zaman serisi verileriyle değil, uzamsal verilerle ).


GÜNCELLEME:

@JoelW .: Diyelim ki yarının (veya bu konu için herhangi bir günün) çarpma olasılığının " p " (ve diyelim ki " p " yüzde 1 gibi).

Bir sonraki uçak kazasının yarın gerçekleşme olasılığının tam olarak bir yılda (26 Temmuz 2015'te ) gerçekleşme olasılığından daha fazla olmasının nedeni, bir sonraki kazanın tam olarak bir yıl içinde olma olasılığının eşit olmasıdır:

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

Mantıklı olmak?

Sonuçta, biz gibi bir ifadeyle dendiğinde bu işler Karşı Sezgisel olmanın nedeni genellikle çünkü olduğunu düşünüyorum: "The odds of a plane crash in one month compared with the odds of one happening tomorrow". Doğal olarak, tam olarak bir ay içinde başlayan 24 saatlik dönemi hemen dikkate almıyoruz. Bunun yerine, biz (ya da en azından ben) bunu daha çok, iyi, esnek bir şekilde düşünme eğilimindeyiz . Yani daha fazla gibi: a month ± a week. Bu ve ara dönemde meydana gelmeyen bir kaza olasılığını hesaba katmayı unuttuğumuz gerçeği ... (Ama yine, belki de sadece ben ...).

Uf!


Ek kaynaklar:

  • Wikipedia'nın Kümeleme Yanılsaması hakkındaki makalesi
  • Özellikle uçak kazalarının "kümelenmesinden" bahseden bir pdf (sayfa 8) ve bir Poisson sürecinin matematiğini kısaca açıklar .

1
@Joel W .: Aslında, bu cevaba daha fazlasını eklemeliyim - düzenlemek için bana birkaç dakika verin ...
Steve S

7
Seyahatin ertelenmesi iddiası, eski şakada TSA'nın uçakta bomba bulunan bir istatistikçiyi nasıl bulduğuyla ilgili olarak aynıdır. Kendisini açıklaması istendiğinde, istatistikçi "Peki, bir bombaya sahip olan bir kişinin olasılıkları küçük ama rahatlık için yeterince küçük değil, ama iki kişinin bombaya sahip olma olasılığı sonsuz. Bu yüzden bir bomba getirdiğimde, neredeyse iki bomba olma şansımız yok ve biz tamamen güvende olacağız. "
whuber

1
Şakanız yerinde, @whuber, ancak "çökmeler arasındaki kısa aralıkların aslında uzun olanlardan daha muhtemel olduğunu söyleme" ile yarının bir çökme olasılığının bir çökme olup olmadığından bağımsız olduğunu söyleme arasında bir tür mantıksal kopukluk var gibi görünüyor. bugün oldu. Sanırım olasılık sezgisel olabilir.
Joel W.

1
Karşı sezgisel olan (benim için) nadir olayların zaman içinde gerçekleşme eğiliminde olduğunu söylüyor. Sezgisel olarak, nadir olayların yakın zamanda gerçekleşmeyeceğini düşünürüm. Bu sezgisel görüşe sahip olan tek kişi ben miyim?
Joel

1
@Steve S: Bağlantı için teşekkürler. Haber makalesinde (1/365) varsayılan değer için üstel dağılım nasıl görünür? Her durumda, Üstel Dağılım, makalenin başlığına değinmez; bu, belirli bir sayıda olayın kısa bir süre içinde gerçekleşme olasılığının uzun bir süre içinde gerçekleşen olayın olasılığı ile karşılaştırılmasını ima eder. .
Joel W.28

4

Uçak kazası sayısı Poisson dağıtılmışsa (belirtildiği gibi), kazalar arasındaki zamanın üstel bir dağılımı vardır. Üstel dağılımın pdf'si monoton azalan zaman fonksiyonudur. Bu nedenle, daha önceki çökmelerin, daha sonraki çökmelerden daha olasıdır.


"Çökmeler arasındaki kısa aralıklar aslında uzun olanlardan daha muhtemeldir." Bu sadece bir uçak kazası olsaydı, yaklaşan seyahatimizi geciktirmeliyiz (istatistiksel nedenlerle)?
Joel W.25

2
Joel, Yazar, "kısa" ve "uzun" ile neyin kastedildiğini ölçene kadar bu alıntı anlamsızdır. Yılda bir beklenen orana sahip bir olay örneğinde, gelecek ay boyunca tekrarlama şansı, bir sonraki kazanın bir yıldan fazla bir süre sonra meydana gelme şansından çok daha az olacaktır. Ne demek istediği, birim zaman başına olasılığın yakın vadede uzun vadeden daha fazla olduğudur. Gerçek olasılıkları karşılaştırmak için birim süre başına olasılığı süreyle çarpmanız gerekir (teknik olarak, süreye entegre etmeniz gerekir).
whuber

@whuber: Başlık, bir dizi uçak kazası olasılığından bahsediyor. Stackexchange'te şu ana kadar söylenen hiçbir şey beni bir uçak kazası kümesinin, yaygın aralıklı uçak kazalarından daha yaygın veya muhtemel olduğuna ikna etmedi. Bana öyle geliyor ki, haber medyasından alıntılar aldatıcı yanıltıcı (belki de yazdığınız gibi zaman aralıkları tanımlanmadığı için). Ne düşünüyorsun?
Joel W.27

"Geniş aralıklı uçak kazaları" ile ne demek istediğinizi bilmiyorum, ne de bu konuda bir "kümeyi" ne anladığınızdan emin değilim. Durumu somutlaştırmak için 0, 10, 11, 12 ve 22 yıllarında (bazı başlangıç ​​tarihinden itibaren) bir dizi nadir olay meydana geldiğini varsayalım. Kaç tane "geniş aralıklı" olay meydana geldi? Kaç tane "küme" oluştu? İlk soruya sıfırdan on'a kadar savunulabilir cevaplar bulabilirim ve ikinci soruya cevaplar sıfır veya bir olabilir.
whuber

1
@whuber: Başlık, geniş aralıklı kazalardan daha fazla kaza kümesine sahip olmanın daha muhtemel olduğunu ima ediyor. Bunu işlevsel hale getirelim. Bir kümenin 3 uçak kazası olduğunu ve kısa bir sürenin 3 ay ve uzun bir sürenin 3 yıl olduğunu varsayalım. 3 ay içinde 3 kazanın 3 yıl içinde olduğundan daha yüksek bir olasılığın olduğunu düşünmek mantıksız görünmektedir. İlk kazayı belirli bir şekilde ele alsak bile, önümüzdeki 3 ay içinde önümüzdeki 3 yıl ile karşılaştırıldığında 2 kazanın daha meydana geleceğini düşünmek mantıksızdır.
Joel W.

0

Diğer cevaplar zaten nasıl bağımsız olayların kümelenmiş olduğu . (O yıllar önce Gleick'in Kaosunu okumak bu fikre gözlerimi açtı.)

Ancak, aslında uçak kazalarının bağımsız olaylar olmadığına dair güçlü kanıtlar vardır . Cialdini'nin Etkisi bu konuda çok iyi bir bölüme sahiptir ( burada birkaç veri bağlantısı olan ve ayrıca kitabın bu kısmından bir alıntı buldum ). Açıkçası bu oldukça tartışmalıdır: temelde bir hava kazası ne kadar halka açıksa, bir pilotu (bilinçli ya da bilinçsiz olarak) uçağını çarpma olasılığının daha yüksek olduğu söylenir. Ancak hipotezin altında yatan psikolojik açıklamalar makul görünmektedir ve veriler de bunu destekliyor gibi görünmektedir.

(Yorumlarda istatistik tabanlı debunking araştırmasına bağlantılar memnuniyetle karşılanacaktır.)


Şunu söylemez: "bazı yaygın kamuoyuna intihar hikayelerinin hemen ardından, ticari havayolu kazalarında ölen insan sayısı artar" diyor.
Scortchi - Monica'yı eski durumuna döndürün

İddiaya göre referans, Phillips (1978) "Cinayet ve intiharla ilgili gazete hikayelerinden hemen sonra uçak kazası ölümleri artıyor", Science , 201 , ss 748-750. Özet "özel, ticari ve kurumsal-yönetici uçaklar" anlamına gelmektedir.
Scortchi - Monica'yı eski durumuna döndürün

Ya da belki de bu: Phillips (1980), "Uçak kazaları, cinayet ve kitle iletişim araçları: taklit ve öneri teorisine doğru", Sosyal Kuvvetler , 58 , 4, burada özette "havayolları" belirtilmiştir.
Scortchi - Monica'yı eski durumuna döndürün

2
Altheide (1981), Social Forces , 60 , 2, "belirli hararetli bir intihar hikayesi" nin, daha sonraki "uçak kazalarından - tamamen " ünlü haham " tanımı gibi seslerden tamamen bağımsız olarak tanımlanamayabileceğini öne sürmektedir .
Scortchi - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.