Sol eğimli verilerde, ortalama ve medyan arasındaki ilişki nedir?


12

Bence medyan demek.

Durum böyle mi?


2
Hangi açık MOOC kursu bu? Ders materyalleri cevabın ne olması gerektiğini gösteriyor?
Glen_b


1
Teşekkürler, bu en azından bir bağlam, ancak geriye kalan tek şey bu konuya fazla ışık tutmayan haftalık okumalar var. Kursun konuyla ilgili ne söylemesi gerektiğini merak ediyorum.
Glen_b -Monica

Yanıtlar:


16

Bu önemsiz bir soru (kesinlikle soruyu soran insanlar kadar önemsiz değil gibi görünüyor).

Zorluk nihayetinde 'çarpıklık' ile ne demek istediğimizi gerçekten bilmediğimiz gerçeğinden kaynaklanıyor - çoğu zaman açıktır, ancak bazen gerçekten değildir. Önemsiz durumlarda 'konum' ve 'yaymak' ile ne demek istediğimizi saptamanın zorluğu göz önüne alındığında (örneğin, konum hakkında konuştuğumuzda ortalama her zaman kastettiğimiz anlamına gelmez), daha ince bir sürpriz olmamalı çarpıklık gibi kavram en azından kaygan. Yani bu bizi kastettiğimiz şeyin çeşitli cebirsel tanımlarını denemeye yönlendiriyor ve her zaman birbirleriyle aynı fikirde değiller.

1) Eğer çarpıklığı ikinci Pearson çarpıklık katsayısıyla ölçerseniz , ortalama ( ) orta değerden daha az olacaktır ( μ - yani bu durumda geriye doğru alırsınız).μμ

(Popülasyon) ikinci Pearson çarpıklığı Ve negatif olacaktır ( "eğri sol") ne zaman μ < ~ μ .

3(μμ)σ,
μ<μ

Bu istatistiklerin örnek sürümleri benzer şekilde çalışır.

Bu durumda ortalama ve medyan arasında gerekli ilişkinin nedeni, çarpıklık ölçüsünün bu şekilde tanımlanmasıdır.

İşte sol eğimli bir yoğunluk (hem ikinci Pearson ölçümü hem de aşağıdaki (2) 'de daha yaygın ölçüme göre):

resim açıklamasını buraya girin

Medyan alt kenarda yeşil, ortalama kırmızı olarak işaretlenmiştir.

Bu yüzden vermenizi istedikleri cevabın ortalamanın medyandan daha az olmasını bekliyorum. Genellikle isim verme eğiliminde olduğumuz türden dağılımlar söz konusudur.

(Ancak okumaya devam edin ve bunun genel bir ifade olarak neden doğru olmadığını görün.)


2) Daha olağanlaştırılmış üçüncü an ile ölçerseniz , o zaman genellikle, ancak hiçbir zaman, ortalamanın medyandan daha az olacağı durumdur.

Yani, zıtlığın doğru olduğu veya bir çarpıklık ölçüsünün sıfır olduğu, diğerinin sıfır olmadığı durumlarda örneklerin oluşturulması mümkündür.

Yani, ortalama, medyan ve moment-çarpıklığın yerleri arasında gerekli bir ilişki yoktur .

Örneğin, aşağıdaki örneği düşünün (aynı örnek, ayrı bir olasılık dağılımı olarak oluşturulabilir):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Yine de (Fisher, üçüncü-an) çarpıklık katsayısı negatiftir (yani ışıklarıyla, çarpık verilerimiz vardır), çünkü ortalamadan sapma küplerinin toplamı negatiftir.

Yani bu durumda sola eğik, fakat medyan.

(Öte yandan, yukarıdaki örnekte 2.7 değerini 3 olarak değiştirirseniz, moment-çarpıklığının sıfır olduğu, ancak ortalamanın medyanı aştığı bir örneğiniz vardır. 3.3 yaparsanız, moment-çarpıklığı pozitiftir. ve ortalama medyanı aşıyor - yani nihayet 'beklenen' yönde.)

Yukarıdaki tanımlardan herhangi biri yerine ilk Pearson çarpıklığını kullanırsanız, bu duruma benzer bir sorun vardır - çarpıklığın yönü genel olarak ortalama ve medyan arasındaki ilişkiyi tespit etmez.


Düzenleme: yorumlardaki bir soruya cevap olarak - ortalama ve medyanın eşit olduğu, ancak moment çarpıklığının negatif olduğu bir örnek. Aşağıdaki verileri göz önünde bulundurun (daha önce olduğu gibi, ayrı bir popülasyon için örnek olarak sayılır; sayıları bir kalıbın yüzlerine yazmayı düşünün).

 1  5  6  6  8 10

ortalama ve medyan her ikisi de 6'dır, ancak ortalamadan sapma küplerinin toplamı negatiftir, bu nedenle üçüncü moment çarpıklığı negatiftir.


1
@Peter Yavaş cevap için özür dilerim, sadece bu tür örnekleri oluşturmakla meşguldüm ve sorunuzu görmedim.
Glen_b

2
Bir sürü ders kitabı tanımı gördüm ve hiçbiri bundan bahsetmedi. Güzel.
Peter Flom - Monica'yı eski durumuna döndürün

6
@Peter Maalesef, birçok temel ders kitabı, gerçek bir araştırma yapmadan diğer ders kitaplarından gelen yanlış bilgileri basitçe tekrarlar ve böylece temel bir yanlış anlama yayılır. Karşı örneklerin, gördüğünüz gibi, yapılandırılması nispeten kolaydır (bunları gerektiğinde elle yaparım). Kendall ve Stuart ( İleri İstatistik Teorisi, Cilt I - başlığın ertelenmesine izin vermeyin, oldukça okunabilir), en azından üçüncü ve dördüncü basımların iyi bilgileri var. Daha yeni basımlar Stuart ve Ord. Aslında bu konuda CV'ye birkaç kez gönderdim.
Glen_b

4
(5k)0.8k0.25k(5k)0.2k0.85k=

1
@Nick Evet, tamsayı ortalamaya sahip binomlar harika örneklerdir.
Glen_b

5

Hayır. Sol eğri verilerin solda uzun bir kuyruğu vardır (düşük uç), bu nedenle ortalama genellikle medyandan daha az olacaktır . (Ancak bir istisna için @ Glen_b'in cevabına bakınız). Raslantı, bence "eğilmiş" görünen verilerin medyandan daha az anlamı olacaktır.

Doğru çarpık veriler daha yaygındır; örneğin, gelir. Ortalama medyandan daha büyüktür.

R kodu

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001

Ortalama hiç medyan ile eşit olabilir mi?
Kunjan Kshetri

unj2 Cevabımın üçüncü moment çarpıklığının negatif ancak ortalama = medyan olduğu bir örnek ekledim.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.