Neden 1 medyanın başka bir medyandan daha düşük olması, grup 1'deki çoğun grup 2'deki çoğundan daha az olduğu anlamına gelmiyor?


9

Aşağıdaki kutuların "çoğu erkek çoğu kadından daha hızlı" olarak yorumlanabileceğine inanıyordum (bu veri kümesinde), çünkü medyan erkeklerin zamanı medyan kadınların zamanından daha az olduğu için. Ama R ve istatistik yarışmasında EdX kursu bana bunun yanlış olduğunu söyledi. Lütfen sezgilerimin neden yanlış olduğunu anlamama yardımcı olun.

İşte soru:

2002'de New York Maratonu'ndan rastgele bir son işlemci örneği düşünelim. Bu veri seti UsingR paketinde bulunabilir. Kitaplığı yükleyin ve nym.2002 veri kümesini yükleyin.

library(dplyr)
data(nym.2002, package="UsingR")

Erkek ve dişilerin bitirme sürelerini karşılaştırmak için kutu grafikleri ve histogramlar kullanın. Aşağıdakilerden hangisi farkı en iyi açıklar?

  1. Erkekler ve dişiler aynı dağılıma sahiptir.
  2. Çoğu erkek çoğu kadından daha hızlıdır.
  3. Erkek ve dişiler, 20 dakika sola kaymış olan eski ile benzer sağ eğik dağılımlara sahiptir.
  4. Her iki dağılım normal olarak ortalama 30 dakika fark ile dağıtılır.

İşte erkekler ve kadınlar için nicelikler, histogramlar ve kutu grafikleri olarak NYC maraton saatleri:

# Men's time quantile
      0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
      0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

Erkek ve dişi zamanlar - histogram

Erkek ve kadın saatleri - boxplot


Aynı dağılımı görsel olarak kontrol etmek için histogramlarınız aynı x etki alanını ve bölmeleri kullanmalıdır; y ekseni ise göreceli frekansı göstermelidir. Çöp bandı boyutu, örneğin 25 veya 50 dakika gibi daha yüksek bir ayrıntıdan yararlanır. Ayrıca, hem kutu grafiklerinde hem de histogramlarda, medyanı (zaten kutu grafikte), ortalama ve mod çizin.
g3o2

Başlıktaki soruyu yeniden belirtin: ve üzerindeki eşit dağılımları göz önünde bulundurun . İkincisinin medyanı daha büyüktür, ancak her birinden rastgele bir gerçekleşme verildiğinde, ikincisinin daha büyük olma olasılığı, daha küçük olması ile aynıdır ( ). Tanımlamak, yani "verilen iki rasgele örnekler X ve Y, her birinden biri ile "en büyük olan" " X ve Y'nin medyan arasındaki ilişki daha bunu söylemez. {0,3}{2}0.5P(X>Y)>0.5
AlexR

Yanıtlar:


7

Yanlış olarak işaretlenmenizin sebebinin çoktan seçmeli soruya verdiğiniz cevabın yanlış olduğunu değil, seçenek 3 "Erkek ve dişilerin eski ile benzer sağ eğik dağılımları olduğu, 20 dakika sola kaydırıldığını" düşünüyorum. sağlanan bilgilere göre daha bilgilendirici olduğu için daha iyi bir seçim olurdu.


Bu açıklamaya katılıyorum. Ayrıca, "çoğundan daha hızlı" çok belirsiz. @Glen_b tarafından verilen cevaba rağmen, bu tür bir dil için kutu grafiklerinde çok daha fazla ayrılık beklerdim. "Erkeklerin% 75'inin tümü kadınların% 75'inden daha hızlıdır" gibi, erkeklerin zamanlarının 75. yüzdelik diliminin kadınların 25. yüzdelik dilimlerinden daha düşük olduğunu düşünüyorum. Ama dil belirsiz.
Sal Mangiafico

1
Ayrıca, bu çoktan seçmeli testler yapma prensibine sahiptir: Her zaman en iyi cevabı seçin .
Sal Mangiafico

Bu mantıklı; diğer seçeneğin YANLIŞ olması değil, doğru seçimin ("Erkek ve dişilerin, öncekiyle benzer sağ eğik dağılımlara sahip olması, 20 dakika sola kayması") doğruydu. Ancak histogramlardaki 20 dakikalık kaymayı pek görmüyorum; Bana 50 dakikalık bir vardiya gibi geliyor. İki şansım olduğu için soruyu doğru anladım, FWIW :-).
kimyon

@cumin: Bunun doğru olduğundan emin değilim. “Çoğu erkek çoğu kadından daha hızlıdır”, “en” ne demek olduğu konusunda belirsizdir - Şimdiye kadar titiz bir tanım gördüğüme inanmıyorum ve sezgisel olarak genellikle% 50'den fazla (belki% 70 +?) . Eğer "çoğunluk" derse o zaman belki daha açık olurdu.
user541686

9

İşte bulabildiğim en küçük karşı örnek:

1,4,10;  B 0,6,9

  • A ( [1, 4, 10])ve B ( [0, 6, 9]) aynı ortalamaya ( 5) sahip

  • B'nin medyan ( 6) değeri A ( 4)

  • Rastgele bir A elemanının rastgele B elemanından daha büyük olması ihtimali 5/9 .

İşte 4 öğeli başka bir örnek:

1,1,3,10;  B 0,0,6,9


7

"Çoğu erkek çoğu kadından daha hızlıdır" potansiyel olarak biraz belirsizdir, ancak normalde niyetini rastgele ebeveynliklere bakarsak, çoğu zaman daha hızlı olur - yani için rastgele (burada ' erkek için zaman ' vb.).P(Mi<Fj)>12i,jMii

Tabii ki ifadenin başka yorumları da mümkündür (sonuçta belirsizlik budur) ve bu diğer olasılıklardan bazıları muhakemenizle tutarlı olabilir.

[Örnekler veya popülasyonlar hakkında konuşup konuşmadığımız konusuna da sahibiz ... “çoğu erkek [...] çoğu kadın” bir nüfus ifadesi gibi görünüyor (potansiyel zamanların nüfusu hakkında) ama sadece zamanları gözlemledik örnek olarak davrandığımızı düşünüyoruz, bu yüzden iddiayı ne kadar geniş yaptığımıza dikkat etmeliyiz.]

Not bu ima değildir . Zıt yönlere gidebilirler.P(Mi<Fj)>12M~<F~

[ Adamın kadından daha hızlı olduğu rastgele MF çiftlerinin oranının 1/2'den fazla olduğunu düşünmekte yanlış olduğunu söylemiyorum - neredeyse kesinlikle haklısın. Sadece medyanları karşılaştırarak söyleyemeyeceğini söylüyorum. Ayrıca, her numunedeki diğer numunenin medyanının üstündeki veya altındaki orana bakarak da söyleyemezsiniz. Farklı bir karşılaştırma yapmanız gerekir.]

Yani, medyan erkek medyan kadından daha hızlı olsa da, rastgele bir erkeğin rastgele bir kadından daha hızlı olma şansının olduğu bir zaman örneğine (veya bu konu için sürekli zaman dağılımına) sahip olmak mümkündür. az daha . Büyük örneklerde, iki zıt göstergenin her biri anlamlı olabilir.12


Misal:

Veri kümesi A:

 1.58  2.10 16.64 17.34 18.74 19.90  1.53  2.78 16.48 17.53 18.57 19.05
 1.64  2.01 16.79 17.10 18.14 19.70  1.25  2.73 16.19 17.76 18.82 19.08
 1.42  2.56 16.73 17.01 18.86 19.98

Veri kümesi B:

 3.35  4.62  5.03 20.97 21.25 22.92  3.12  4.83  5.29 20.82 21.64 22.06
 3.39  4.67  5.34 20.52 21.10 22.29  3.38  4.96  5.70 20.45 21.67 22.89
 3.44  4.13  6.00 20.85 21.82 22.05

Veri kümesi C:

 6.63  7.92  8.15  9.97 23.34 24.70  6.40  7.54  8.24  9.37 23.33 24.26
 6.18  7.74  8.63  9.62 23.07 24.80  6.54  7.37  8.37  9.09 23.22 24.16
 6.57  7.58  8.81  9.08 23.43 24.45

(Veriler burada , ancak orada farklı bir amaç için kullanılıyor - hatırlama için bunu kendim ürettim)

A <B'lerin oranının 2/3, A <C oranının 5/9 ve B <C oranının 2/3 olduğunu unutmayın. Hem A'ya karşı B hem de B'ye karşı C% 5 düzeyinde anlamlıdır, ancak numunelerin yeterli kopyalarını ekleyerek herhangi bir düzeyde önem kazanabiliriz. Hatta örnekleri çoğaltarak ancak yeterince küçük titreşim ekleyerek (noktalar arasındaki en küçük boşluktan yeterince küçük) bağları bile önleyebiliriz.

Örnek medyanlar diğer yöne gider: medyan (A)> medyan (B)> medyan (C)

Yine, örnekleri tekrarlayarak medyanların - herhangi bir önem seviyesine - bazı karşılaştırılması için önem kazanabiliriz.

A, B ve C numunelerinin Stripchart'ı, medyanları, vb.

Bunu şimdiki problemle ilişkilendirmek için A'nın "kadınların zamanları" ve B'nin "erkeklerin zamanları" olduğunu hayal edin. O zaman medyan erkeklerin zamanı daha hızlıdır, ancak rastgele seçilen bir erkek zamanın 2 / 3'ü rastgele seçilen bir kadından daha yavaş olacaktır.

İşaretimizi A ve C örneklerinden alarak, aşağıdaki gibi daha büyük bir veri kümesi (R cinsinden) oluşturabiliriz:

n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))

F'nin medyanı 16.25, M'nin medyanı 11.25, ancak F <M'nin 5/9 olacağı vakaların oranı olacaktır.

[N / 3 yerine ve parametreleri ile bir binom varyantı yerleştirirsek, F dağılımının medyanının 16.25 olduğu, M dağılımının medyanının 11.25 olduğu bir popülasyondan örnek alıyor olurduk. Bu arada bu popülasyonda F <M'nin tekrar 5/9 olma olasılığı.]n13

Ayrıca ve ; (önemli bir mesafeyle).P(F<med(M))=23P(M>med(F))=23med(M)<med(F)


Ben nasıl görebilirsiniz vasıta zıt yönlerde gidebilir, ama burada önsezilerimi itiraf OP en eşleştireceğimiz. Medyanların nasıl olabileceğini görmüyorum (örnekleme hatası dışında).
gung - Monica'yı eski durumuna getirin

@gung Bir örnek ekledim. İlk sezgilerimi bu şekilde delmeyi seviyorum - onlara karşı örnekler bularak. Daha fazla karşılaşırsam (başka bir yerde başka bir yere sahip olduğuma inanıyorum) onlardan bahsetmeye çalışacağım.
Glen_b

Orig sorusundaki kutu grafik, erkeklerin yaklaşık% 60-65'inin (göz küresi ile) kadınlar için ortalama süreden daha az (yani kadınların% 50'sinden daha az) zamana sahip olduğunu göstermektedir. Açıklamak istediğim parça bu.
kimyon

Yukarıdaki A ve C numunelerimdeki @cumin, C'lerin 2 / 3'ü A için medyandan daha azdır (çoğu C, medyan A'dan daha hızlıdır), rastgele için , yaklaşık% 56'dır ( çoğu zaman rastgele bir A rastgele bir C'yi yener). [Sonuçlarınızın verileriniz hakkında gerçekten yanlış olduğunu düşünmüyorum, sadece bu bilgi parçası bunu oluşturmak için yeterli olmayacaktır.] - Yazımın sonunda bu konu hakkında küçük bir düzenleme yaptım karşılaştırması. Histogramlarınızdaki ve kutu grafiklerinizdeki ayrıntıları aynı anda eşleştirmek ve inşa ettiğim tersine dönüş türünü elde etmek çok zor olacağını düşünüyorumP(Ai<Cj)ij
Glen_b -Restate Monica 5

3
"Çoğu erkek çoğu kadından daha hızlı" ifadesini "erkeklerin en az% 50'si kadınların en az% 50'sinden daha hızlı" olarak yorumluyorum. Başka bir deyişle: bir erkek X verildiğinde, X'in kadınların% 50'sinden daha hızlı olup olmadığını sormak mantıklıdır. Bana göre, iddia erkeklerin en az% 50'sinin bu mülke sahip olduğunu söylüyor. Medyan adam medyan kadından daha hızlıysa bu (bence) DOĞRU, çünkü erkeklerin% 50'si kadınların% 50'sinden daha hızlı olan medyan kadından daha hızlı olan medyan adamdan daha hızlı olacaktır. (Ama bunun kadın örneğindeki çiftlerin sadece% 25'ini kapsadığını unutmayın, ki bence harika örneğinizi açıklıyor.)
mathmandan

3

Bu fikirlerin önemli bir pratik uygulamasını gösteren bu blog yazısından aşağıdaki rakamlar alınmıştır .

Standardizasyon, 2 dağılımı karşılaştırmak için güçlü bir cihaz sağlar. Aşağıdaki 3 rakam, İngiltere Ulusal Çocuk Ölçüm Programı'ndan (NCMP) 130 aylık erkek ve kız çocuklarının boylarını karşılaştırmaktadır. (Bu veri kümesindeki modal yaştı; Tek bir yaş kohortunda en fazla veriyi ve dolayısıyla en pürüzsüz grafikleri elde etmek için seçtim.)

Şekil 1: İngiltere'nin Ulusal Çocuk Ölçüm Programı'ndan (NCMP) 130 aylık erkek ve kız çocukları yükseklikleri

Şekil 1: İngiltere'nin Ulusal Çocuk Ölçüm Programı'ndan (NCMP) 130 aylık erkek ve kız çocukları yükseklikleri

Şekil 2: 130 aylık erkek ve kız çocuklarının boy yüzdeleri.  Kaynak: İngilizce NCMP

Şekil 2: 130 aylık erkek ve kız çocuklarının boy yüzdeleri. Kaynak: İngilizce NCMP

Şekil 3: 130 aylık kız çocuklarının yüksekliklerinin aynı yaştaki erkek çocuklara göre dağılımı.

Şekil 3: 130 aylık kız çocuklarının yüksekliklerinin aynı yaştaki erkek çocuklara göre dağılımı.

Bu rakamların sonunda, boy karşılaştırması erkeklerin boylarına göre standardize edilmiştir . Böylece, Şekil 3'teki noktalı gri çizgiler boyunca okuma yaparak aşağıdaki gibi ifadeler yapabilirsiniz:

  • Erkekler için ortanca (yani, 50. persentil) yükseklik kızlar için sadece 45. persentildir. Böylece kızların% 100 -% 45'i =% 55'i medyan erkek çocuktan daha uzundu.
  • Kızlar için en üst çeyrek yüksekliği (75. persentil) erkekler için en üst çeyreğe (80. persentil) vurur. Bu nedenle, 130 mos yaşındaki çocuklar arasında, 4 kızdan 3'ünden daha uzun olan bir kız da 5 erkekten 4'ünden daha uzun.

Bu komplodaki olası karışıklık noktalarından biri söz edilmeyi hak ediyor. Erkeklerin 45 ° çizgisi arsada kızların eflatun eğrisinden daha yüksek olmasına rağmen, bu gözlem yine de bu yaşta (bunlar 6. sınıflar), kızların genellikle erkeklerden daha uzun olduğu bilinen gerçeğe karşılık gelmektedir. . Bu uzunluğun, macenta eğrisinin mavi çizgiye göre sağa kayması gerçeğine uygun şekilde yansıtıldığını unutmayın .

Bu yaklaşım oldukça geneldir . Böyle bir karşılaştırma altında, standartlaştırdığınız gruplardan biri 45 ° çizgisi olur. Diğer grup genel olarak sol alttan sağa doğru çizilmiş herhangi bir monoton artış eğrisi olabilir . Temel dağılımların sürekli olması şartıyla (yoğunlukların nokta kütleleri eksik olduğu), karşılaştırılan eğri sürekli olacaktır. Altta yatan yoğunluklar aynı desteği paylaşıyorsa, eğri ila .(0,0)(1,1)

Orijinal sorunuz şimdi geometrik terimlerle yeniden şekillendirilebilir, Şekil 3'teki macenta eğrisini aynı anda elde etmek için çizip çizemeyeceğinize dair bir soru olarak (a) medyanlar arasındaki varsayılan ilişkiyi ve (b) @Glen_b cevabında açıklandı (doğru, inanıyorum). Dağılım süreksizliklerinin (yoğunluklardaki nokta kütleleri) 'patolojik' bir vakanın sağlanmasına olanak sağlayıp sağlayamayacağını merak ediyorum. Böyle bir patolojik vakanın 'kuralı ispatlayan istisna' olacağına inanıyorum.


Biri en yalın ve analize daha resmi dil müsait halinde sınav soru mantıksal çevirisini yaparsa biz bireysel söylemek isteyeceğini, ardından (yukarıdan çocukların yükseklikleri ayarını kullanarak) mülkiyet TMB eğer sahiptir isimli t aller daha m ost b OYS. Daha sonra sınav sorunuz basitçe çoğu kızın TMB mülküne sahip olup olmadığını sordu . Eğer kişi 'en' yi yarıdan daha fazla anlamına gelirse , TMB özelliğine sahip olmak, medyan boydaki çocuktan daha uzun olmak demektir. Çoğu kızın TMB mülküne sahip olup olmadığını sormak , medyan kızınxxbu özelliği var. Bu hesapta, sınav sorusunun cevabı evet olacaktır .

Öte yandan, eğer "en" nin gerçek amacı ">% 50" ise, daha kesin bir ifadenin "çoğunluğu" nun kullanılması beklenebilir. Biri bana "muhtemelen" bir şey olacağını söylese,% 60 veya daha fazla bir öznel olasılık olduğunu düşünüyorum. Benzer şekilde, benim için "en"% 70-80 gibi bir şey ifade ediyor. Açıkçası, yukarıdaki tablodan, eğer 'en'% 52.5'ten daha katı bir kriter olarak alınırsa, "çoğu kız [onların sahip oldukları mülkün çoğunun erkeklerden daha uzun olduğunu" söyleyemezsiniz. Sınav sorusunun mantığının bir kısmının, sayısal kavramlarla ilgili olarak kelimelerin incelenmesini teşvik etmek olup olmadığını merak ediyorum. (Bunun biraz aptalca olduğunu düşünüyorsanız, bu grafikleri düşününİnsanların farklı olasılıklı kelimeleri ve cümleleri nasıl yorumlama eğiliminde olduklarını gösterir.) Belki de amaç, gerçek dünya dağılımlarında çok fazla varyasyon olduğu ve tek bir istatistiğin (medyan, ortalama, neye sahip- siz) geniş, kapsamlı ifadeleri nadiren destekleyeceksiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.