Bence medyan demek.
Durum böyle mi?
Bence medyan demek.
Durum böyle mi?
Yanıtlar:
Bu önemsiz bir soru (kesinlikle soruyu soran insanlar kadar önemsiz değil gibi görünüyor).
Zorluk nihayetinde 'çarpıklık' ile ne demek istediğimizi gerçekten bilmediğimiz gerçeğinden kaynaklanıyor - çoğu zaman açıktır, ancak bazen gerçekten değildir. Önemsiz durumlarda 'konum' ve 'yaymak' ile ne demek istediğimizi saptamanın zorluğu göz önüne alındığında (örneğin, konum hakkında konuştuğumuzda ortalama her zaman kastettiğimiz anlamına gelmez), daha ince bir sürpriz olmamalı çarpıklık gibi kavram en azından kaygan. Yani bu bizi kastettiğimiz şeyin çeşitli cebirsel tanımlarını denemeye yönlendiriyor ve her zaman birbirleriyle aynı fikirde değiller.
1) Eğer çarpıklığı ikinci Pearson çarpıklık katsayısıyla ölçerseniz , ortalama ( ) orta değerden daha az olacaktır ( ∼ μ - yani bu durumda geriye doğru alırsınız).
(Popülasyon) ikinci Pearson çarpıklığı Ve negatif olacaktır ( "eğri sol") ne zaman μ < ~ μ .
Bu istatistiklerin örnek sürümleri benzer şekilde çalışır.
Bu durumda ortalama ve medyan arasında gerekli ilişkinin nedeni, çarpıklık ölçüsünün bu şekilde tanımlanmasıdır.
İşte sol eğimli bir yoğunluk (hem ikinci Pearson ölçümü hem de aşağıdaki (2) 'de daha yaygın ölçüme göre):
Medyan alt kenarda yeşil, ortalama kırmızı olarak işaretlenmiştir.
Bu yüzden vermenizi istedikleri cevabın ortalamanın medyandan daha az olmasını bekliyorum. Genellikle isim verme eğiliminde olduğumuz türden dağılımlar söz konusudur.
(Ancak okumaya devam edin ve bunun genel bir ifade olarak neden doğru olmadığını görün.)
2) Daha olağanlaştırılmış üçüncü an ile ölçerseniz , o zaman genellikle, ancak hiçbir zaman, ortalamanın medyandan daha az olacağı durumdur.
Yani, zıtlığın doğru olduğu veya bir çarpıklık ölçüsünün sıfır olduğu, diğerinin sıfır olmadığı durumlarda örneklerin oluşturulması mümkündür.
Yani, ortalama, medyan ve moment-çarpıklığın yerleri arasında gerekli bir ilişki yoktur .
Örneğin, aşağıdaki örneği düşünün (aynı örnek, ayrı bir olasılık dağılımı olarak oluşturulabilir):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
Yine de (Fisher, üçüncü-an) çarpıklık katsayısı negatiftir (yani ışıklarıyla, çarpık verilerimiz vardır), çünkü ortalamadan sapma küplerinin toplamı negatiftir.
Yani bu durumda sola eğik, fakat medyan.
(Öte yandan, yukarıdaki örnekte 2.7 değerini 3 olarak değiştirirseniz, moment-çarpıklığının sıfır olduğu, ancak ortalamanın medyanı aştığı bir örneğiniz vardır. 3.3 yaparsanız, moment-çarpıklığı pozitiftir. ve ortalama medyanı aşıyor - yani nihayet 'beklenen' yönde.)
Yukarıdaki tanımlardan herhangi biri yerine ilk Pearson çarpıklığını kullanırsanız, bu duruma benzer bir sorun vardır - çarpıklığın yönü genel olarak ortalama ve medyan arasındaki ilişkiyi tespit etmez.
Düzenleme: yorumlardaki bir soruya cevap olarak - ortalama ve medyanın eşit olduğu, ancak moment çarpıklığının negatif olduğu bir örnek. Aşağıdaki verileri göz önünde bulundurun (daha önce olduğu gibi, ayrı bir popülasyon için örnek olarak sayılır; sayıları bir kalıbın yüzlerine yazmayı düşünün).
1 5 6 6 8 10
ortalama ve medyan her ikisi de 6'dır, ancak ortalamadan sapma küplerinin toplamı negatiftir, bu nedenle üçüncü moment çarpıklığı negatiftir.
Hayır. Sol eğri verilerin solda uzun bir kuyruğu vardır (düşük uç), bu nedenle ortalama genellikle medyandan daha az olacaktır . (Ancak bir istisna için @ Glen_b'in cevabına bakınız). Raslantı, bence "eğilmiş" görünen verilerin medyandan daha az anlamı olacaktır.
Doğru çarpık veriler daha yaygındır; örneğin, gelir. Ortalama medyandan daha büyüktür.
R kodu
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001