Daha önemli istatistik: 'tüm kadınların yüzde 90'ı kurtuldu' veya 'hayatta kalanların yüzde 90'ı kadındı'?


14

Titanik için aşağıdaki ifadeleri göz önünde bulundurun:

Varsayım 1: Gemide sadece erkekler ve kadınlar vardı

Varsayım 2: Kadınların yanı sıra çok sayıda erkek vardı

Açıklama 1: Tüm kadınların yüzde 90'ı hayatta kaldı

İfade 2: Hayatta kalanların yüzde 90'ı kadındı

Birincisi, kadınların kurtarılmasının muhtemelen yüksek önceliğe sahip olduğunu gösterir (erkeklerin kurtarılıp kurtarılmamasına bakılmaksızın)

İkinci istatistik ne zaman yararlıdır?

Bunlardan birinin neredeyse her zaman diğerinden daha yararlı olduğunu söyleyebilir miyiz?


40
hangi amaç için daha yararlı?
Aksakal

12
Bu yanıtlardan Hayrete hiçbiri söz etti Simpson Paradox
Nemo

3
Bunun kadın olup olmadığınıza bağlı olduğunu söyleyebilirim!
meh

6
İlk ifade, erkekler için karşılaştırılabilir bir istatistik olmadan anlamlı değildir.
Barmar

1
@RahulSaha Fakat eğer erkeklerin% 95'i hayatta kalırsa, bunun anlamı erkeklere daha fazla öncelik vermiş olmaları olabilir. Bu yüzden bir karşılaştırmaya ihtiyaç vardır.
Barmar

Yanıtlar:


54

Duruştukça, İfade 1 veya 2'den hiçbiri çok yararlı değildir. Yolcuların% 90'ı kadın olsaydı ve insanların% 90'ı rastgele hayatta kalsaydı, her iki ifade de doğru olurdu. İfadelerin, yolcuların genel kompozisyonu bağlamında değerlendirilmesi gerekir. Ve genel hayatta kalma şansı.


Farz edin ki, her biri 100 erkek. İşte kadınlara (W) karşı erkeklerin (M) ve ölülere (D) karşı hayatta kalan (S) birkaç olası matris:

  |  M |  W
------------
S | 90 | 90
------------
D | 10 | 10

Kadınların% 90'ı hayatta kaldı. Erkeklerin% 90'ı gibi. İfade 1 doğrudur, İfade 2 yanlıştır, çünkü hayatta kalanların yarısı kadındır. Bu, hayatta kalan birçok insanla tutarlıdır, ancak cinsiyetler arasında fark yoktur .

  |  M |  W
------------
S | 10 | 90
------------
D | 90 | 10

Kadınların% 90'ı hayatta kaldı, ancak erkeklerin sadece% 10'u. Hayatta kalanların% 90'ı kadındı. Her iki ifade de doğrudur. Bu cinsiyetler arasındaki farkla tutarlıdır : kadınların hayatta kalma olasılığı erkeklerden daha fazlaydı.

  |  M |  W
------------
S |  1 |  9
------------
D | 99 | 91

Kadınların% 9'u hayatta kaldı, ancak erkeklerin sadece% 1'i hayatta kaldı. Hayatta kalanların% 90'ı kadındı. İfade 1 yanlış, İfade 2 doğrudur. Bu yine cinsiyetler arasındaki farkla tutarlıdır : kadınların hayatta kalma olasılığı erkeklerden daha fazlaydı.


3
(or indeed, if *everyone* survived)... Herkes hayatta kalırsa, oranlara bakılmaksızın tüm kadınların% 100'ü hayatta kaldı.
Bridgeburners

1
@Bridgeburners: tamamen haklısın ve bilgisayarımdan uzaktayken bana vurdu. Teşekkürler, cevabımı düzenledim.
Stephan Kolassa

18

Yüzünde, sadece bilgi akışının yönü nedeniyle, cinsiyete bağlı koşullu hayatta kalma koşullu olasılığı daha yararlıdır. Bir kişinin cinsiyeti, hayatta kalma durumundan önce bilinir ve bu olasılık, öngörülü bir şekilde, ileriye dönük olarak kullanılabilir. Ayrıca, kadınların prevalansından etkilenmez. Şüphe duyduğunuzda, tahmini düşünün.


Evet, yüzünde. Yani, bunun söz konusu gerçek istatistikler için nasıl geçerli olduğunu anladığımdan emin olmak için ... 1 numaralı ifadenin yararlı olduğunu söylüyorsunuz çünkü bana bir kadın olursam, 1912'de büyük bir yolcu gemisinde buzdağı istila edilmiş sularda batıyor, sonra hayatta kalma şansım% 90 mı? Ve o zamandan bu yana hayat kurtaran teknoloji ve uygulamaların iyileştiğine dair makul varsayımın eklenmesi, bugün böyle bir durumdan kurtulma şansımın muhtemelen % 90'dan daha iyi olduğu anlamına mı geliyor? Güzel! ;-)
Don Hatch

Bu açıklamalar orijinal tanımlayıcı hedefin ötesine satılıyor.
Frank Harrell

Hedefi doğru bulduğunuzdan emin misiniz? Soru, görünüşe göre, bu açıklamaların gerçek Titanik hakkındaki yararlılığıyla ilgilidir, ki bu gerçekte tahminler yapmak için o kadar da yararlı değildir, çünkü o zamandan beri çok şey değişti. Görünüşe göre sezgiselci ona atılan ilk gerçek örnekte başarısız oldu, değil mi? Bu iyi bir başlangıç ​​gibi görünmüyor. Öte yandan, belki OP şimdiki senaryolar uygulanan aynı formda genel soru için bir proxy olarak Titanik soruyu amaçlanan yapmak öngörü alaka var; Bilmiyorum.
Don Hatch

1
Tıpkı Regresyon Modelleme Stratejileri kitabımda TItanic yolcuların hayatta kalma olasılıkları hakkında detaylı bir vaka çalışmam olduğu gibi, neler olduğunu keşfetmede çok değer var. Gelecekteki Titanics'i tahmin etmek için o lojistik modelden tahmin edilen olasılıkları değil, cankurtaran seçim sürecinde kalıpları keşfetmek için kullanıyorum.
Frank Harrell

6

Birincisi, kadınların kurtarılmasının muhtemelen yüksek önceliğe sahip olduğunu gösterir (erkeklerin kurtarılıp kurtarılmamasına bakılmaksızın)

"Öncelik" kelimesi Latince'den "önce" anlamına gelir. Öncelik, birinin başka bir şeyden önce geldiği bir şeydir ("önce", "daha önemli" anlamında kullanılır). Kadınları kurtarmanın bir öncelik olduğunu söylüyorsanız, kadınları kurtarmak başka bir şeyden önce gelmek zorundadır. Ve doğal varsayım, daha önce gelen şeyin insanları kurtarmak olduğu. "Erkekleri kurtarıp kurtarmamaya bakılmaksızın" derseniz, daha önce ne olduğunu merak etmeye devam ediyoruz.

Genel hayatta kalma oranının ne olduğunu bilmiyorsak, kadınların hayatta kalma oranının yüksek olduğu pek bir şey söylemiyor. Bulunduğum son gemi, kadınların% 90'ından fazlası hayatta kaldı, ancak kadınları kurtarmanın yüksek bir öncelik olduğunu göstermesi olarak tanımlamam.

Ve hayatta kalanların yüzde kaçının kadın olduğunu bilmek, genel olarak insanların yüzde kaçının kadın olduğunu bilmeden fazla bir şey söylemiyor.

İstatistiğin daha faydalı olduğu durum gerçekten duruma bağlıdır. Bir şeyin ne kadar tehlikeli olduğunu bilmek istiyorsanız, ölüm oranı daha önemlidir. Bir şeyin ne kadar tehlikeli olduğunu neyin etkilediğini bilmek istiyorsanız, kayıpların yüzde dağılımı önemlidir.


2
Güzel eleştiri :-) "En son bulunduğum gemi, kadınların% 90'ından fazlası hayatta kaldı, ama kadınları kurtarmanın yüksek bir öncelik olduğunu göstermek olarak tanımlayamazdım." Tabii ki .. onları denize atmak kıyasla yüksek öncelik! Elbette, bu "yüksek öncelikli" saçma bir yorumdur, fakat OP "erkekleri kurtarmaya göre daha yüksek öncelikli" yorumu dışladığı için, geriye kalan tek şey saçma yorumlardır.
Don Hatch

3

Bu olasılıkların nasıl ilişkili olduğunu incelememiz muhtemelen yararlıdır.

WS

P(S|W)=0.9

P(W|S)=0.9

Bayes Teoremi, bu olasılık ifadelerinin nasıl ilişkili olduğunu göstermektedir.

P(S|W)=P(W|S)P(S)P(W)

P(S)P(W)

P(S)P(W)


3
Sonucunuzun aksine, ne P (S) ne de P (W) bilinmiyorsa, hem P (S | W) hem de P (W | S) aynı sinir bozucu yararlılık eksikliğinden muzdarip olduğunu söyleyebilirim. P (S) ve P (W) 'nin tam olarak bilinmesi durumunda ne söylenebileceğine dair henüz net bir resim yok.
Don Hatch

P(W)=0.5

1
Evet, bu doğru görünüyor ve karar, bilgi göz önüne alındığında bile bilginin yetersiz olduğu şeklinde görünüyor. Söylemeliyim ki, her ne zaman sadece P (W | S) veya sadece P (S | W) 'den hangi bilgileri çıkarabileceğimi düşünmeye başladığımda, hatta P (W) veya başka bir şey ekleyerek, "neden dünyadayım Bunu düşünüyorum? Neden bana sadece bu yüzdeleri verdiler? Bana tüm masayı göster ".
Don Hatch

3

Neyin yararlı olduğunu düşündüğüne bağlıdır.

P(S|W)>P(S|M)

Öte yandan, hayatta kalan öykülerinin neden çoğunlukla kadınlardan geldiğini merak ediyorsanız, açıklama 2, açıklama 2'yi başka bilgilerin yokluğunda bile yararlı hale getirerek açıklayacaktır.

İfade 1'in bağlam dışı için yararlı olduğunu düşünemiyorum. Kadınları kurtarmaya verilen öncelik hakkında başka hiçbir şeye kıyasla kesinlikle bir şey söylemiyor. 1 ifadesinin benim için yaptığı tek şey, "bana daha fazla anlat" dememi sağlaması.


0

Yüzeyde (ya da gerçeklikten soyutlanmış olarak) her iki ifade de devletin hedefi için eşit derecede yararsız görünmektedir. Bununla birlikte, bağlam dikkate alındığında, ikinci ifade açıkça daha yararlıdır.

Bildirim 2

w

w=px/(px+(1p)z)
pxz

hipo testini yapıyoruzH0:x>z

H0

(1w)px=w(1p)z
x=w(1p)z/((1w)p)
H0
x=w(1p)z/((1w)p)>z
w(1p)>(1w)p
0.9(1p)>0.1p
1p>p/9
p<0.9

p1/2

Bildirim 1

x=0.9zx>z

xz

p1/2px+(1p)zxzp1/2

px+(1p)zx=0.9
x>>z

Sonuç

Her iki ifadenin de hipoyu desteklediğini söyleyebilirim, kadınların erkeklerden daha fazla hayatta kalma olasılığı daha yüksektir, ancak İfade 1 oldukça zayıftır, ancak İfade 2 ile birlikte varsayımlarla birlikte neredeyse kesin olarak hipoyu oluşturur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.