Eğer demek bu kadar hassassa, neden en baştan kullanıyorsunuz?


84

Medyanın aykırı maddelere karşı dirençli olduğu bilinen bir gerçektir. Bu durumda, ortalamayı ne zaman ve neden kullanalım?

Belki de düşünebileceğim bir şey, aykırı değerlerin varlığını anlamaktır; yani, medyan ortalamadan uzaksa, dağıtım çarpıktır ve aykırı değerlerle ne yapılacağına karar vermek için verilerin incelenmesi gerekir. Başka kullanım var mı?


14
İlk soruya ilişkin hızlı bir not: İstatistiki ortalama, popülasyonun sadece ilk anıdır, medyan ise değildir. CLT, büyük sayılar kanunu vb. Kullanmaya çalışmak, yine sınırlı anların varlığına bağlısınız. Örneğin Cauchy dağılımı: Ortanca var olsa da, demek değildir;)
Dmitrij Celov

2
@Dmitrij Bu derin ve anlayışlı bir cevaptır. Neden bir cevapta ayrıntı vermiyorsun?
whuber

Ortalamayı kullanmadıysan, duygularını incitirdin? (Üzgünüm, karşı koyamadım.)
Daniel R Hicks

3
@ Daniel R Hicks: Bu oldukça kaba, değil mi? (Üzgünüm, aynı zamanda direnemedim).
Muhammad Alkarouri

3
Bu soru normalden çok daha ilginçtir, "Neden sadece her zaman sağlam algoritmalar kullanmıyoruz?" soru, ancak "sağlam == büyülü" diye temel bir düşünceye sahip olabilir ve sadece sağlam yöntemler kullanırsak, verilerimizi incelemek, anlamak veya farklı türden doğruluk sorunları hakkında endişelenmek zorunda kalmayız. "güçlü". Yine de +1.
Wayne

Yanıtlar:


113

Bir anlamda, ortalama kullanılır çünkü o verilere duyarlıdır. Dağılım simetrik hale gelirse ve kuyruklar normal dağılıma benziyorsa, ortalama, merkezi eğilimin çok etkili bir özetidir. Medyan, herhangi bir sürekli dağılım için sağlam ve iyi tanımlanmış olsa da, veriler normal bir dağılımdan geldiyse, ortalama kadar verimlidir. Bizi, kullandığımızdan daha fazla kullanmamızı engelleyen medyanın bu göreceli verimsizliğidir. Göreceli verimsizlik, örneklem büyüklüğü arttıkça küçük bir mutlak verimsizliğe dönüşür, bu nedenle büyük için medyanı kullanma konusunda daha suçsuz olabiliriz. n2πn

Bir değişim ölçüsü için (yayılma, dağılma), standart sapma kadar 0.98, yani Gini'nin ortalama farkının etkili olduğu çok sağlam bir tahmin edicinin bulunduğunu not etmek ilginçtir. Bu, herhangi iki gözlem arasındaki ortalama mutlak farktır. [Gini'nin ortalama farkı ile tahmin edilen aynı miktarı tahmin etmek için örnek standart sapmayı sabitle çarpmanız gerekir.] Merkezi eğilimin etkin bir ölçüsü, Hodges-Lehmann tahmincisi, yani tümüyle ikili araçların medyanıdır. Yorumu daha basit olsaydı daha çok kullanırdık.


13
Merkezi eğilim eğiliminde olan Hodges-Lehmann tahmincisinden bahsettiği için +1. Birçok bakımdan, ortalama ve ortanca arasındadır. Büyük örneklemde hesaplamak kolay olsaydı, bir yer ölçüsü olarak ortalamadan ya da medyandan daha popüler olurdu, sanırım.
ttnphns

BTW, @Frank, Hodges-Lehmann merkezinin hangi teorik örnekleme dağılımını takip ettiğini biliyor musunuz? Ben - ve ilgileniyorum.
ttnphns

16
Yorumunuz için teşekkürler. R'deki bir astar, onu N = 5000: 'e kadar verimli bir şekilde hesaplayabilir w <- outer(x, x, '+'); median(w[row(w) >= col(w)])/2. Önemsiz bir C, Fortran veya Ratfor programı R tarafından cayır cayır yanan hızlı yapmak için çağrılabilir. R'deki ICSNP paketi, hl.locfonksiyonuyla oldukça verimli bir uygulamaya sahiptir . N = 5000 için yukarıdaki koddan 2.66 kat daha hızlıydı (toplam süre 1.5 saniye). Verimli bir güven aralığı elde etmek de iyi olurdu.
Frank Harrell,

@ Standart sapma için ve tahmin edicileri hakkında ne söyleyebilirsiniz ? Gini'nin normal olmayan dağılımlar için ortalama farkını kullanarak tahmini için hangi sabiti kullanmalıyım ? Bu sabitin hesaplanmasındaki prosedürü açık erişim kaynaklarında açıklayan makaleleri bulamadım ... Ayrıca Gini'nin ortalama farkının sağlamlığı hakkında herhangi bir bilgi bulamadım, nerede arayacağınız konusunda bir fikir verebilir misiniz? Q n σSnQnσ
Alman Demidov

1
Dağılım önlemlerinden bahsediyoruz, bu nedenle modellerin karşılaştırılması söz konusu değildir (ve "Gini'nin Dizini" ile karıştırmayın). Gini'nin ortalama farkı mutlak bir ölçüdür. Yorumlanması diğer önlemlerden daha kolaydır. Her dağıtım için farklı bir sabit hesaplamanız gerekeceği gerçeği bana sabiti kullanmak istemediğimizi söylüyor.
Frank Harrell,

36

Çok sayıda büyük cevap zaten var, ancak geri adım atıp biraz daha basitleşmek, bunun cevabını sorduğunuz soruya bağlı olduğu için söyleyebilirim. Ortalama ve ortanca farklı soruları cevaplar - bazen biri uygun, bazen diğer.

Medyanın aykırı değerler olduğunda, ya da çarpık dağılımlarda ya da her neyse kullanılması gerektiğini söylemek kolaydır. Ama bu her zaman böyle değildir. Gelir al - hemen hemen her zaman medyanla rapor edilir ve genellikle doğru olur. Ancak, bütün bir topluluğun harcama gücüne bakıyorsanız, bu doğru olmayabilir. Ve bazı durumlarda, mod bile en iyisi olabilir (özellikle veriler gruplandırılmışsa).


8
Başka hiç kimsenin hitap etmediği görünen nokta için + 1: farklı kavramlar ve farklı soruları cevaplarlar. Ayrıca birçok durumda tüm dağıtımı tek bir özet numaraya yoğunlaştırarak çok şey kaybedilir, bu yüzden bazen ikisi de kötü bir iş çıkarır.
Michael McGowan

25

Bir değer bizim için çöp olduğunda biz buna "aykırı" diyoruz ve analizin ona karşı güçlü olmasını istiyoruz (ve medyanı tercih edin); aynı değer çekici olduğunda biz buna "aşırı" diyoruz ve analizin ona duyarlı olmasını istiyoruz (ve ortalamayı tercih ediyorum). Diyalektik ...

Ortalama, dağılımın gerçekleştiği yere bakılmaksızın bir değer değişikliğine eşit tepki verir. Örneğin, 1 2 3 4 5sizde 2 ile herhangi bir değeri artırabilir - ortalamanın artışı aynı olacaktır. Medyan'ın tepkisi daha az "tutarlı" dır: 4 veya 5 veri noktalarına 2 ekleyin ve medyan artmayacaktır; ancak 2. noktaya 2 ekleyiniz - kayma medyanın üzerindedir ve medyan dramatik bir şekilde değişir (ortalamanın büyük ölçüde değişeceğinden büyük ölçüde).

Ortalama her zaman tam olarak bulunur. Ortanca değil; örneğin, sette 2 ile 3 arasındaki 1 2 3 4 herhangi bir değere medyan denilebilir. Bu nedenle, medyanlara dayalı analizler her zaman benzersiz bir çözüm değildir.

Ortalama, minimum kareler toplamı sapmalarının bir odağıdır. Doğrusal cebire dayanan pek çok optimizasyon görevi (ünlü OLS regresyonu dahil) bu karesel hatayı en aza indirger ve dolayısıyla ortalama kavramını ima eder. Ortanca minimum mutlak-toplam sapma toplamı odağı. Bu hatayı en aza indirmek için optimizasyon teknikleri doğrusal değildir ve daha karmaşık / kötü bilinmektedir.


2
+1 İlk paragrafın tamamen dışlayıcı bir tespiti ima ettiği için yanlış anlaşılabileceğine dair endişelerim var. Yine de bunu ima etmek istediğini sanmıyorum.
whuber

8
+1 | Bence ilk cümle dışlayıcı tespit uygulamasının tamamen öznel olduğunu ve bu nedenle olduğu gibi kalmaya oy verdiğimi ima ediyor.
John

2
Outliar tespiti öznel felsefi veya ahlaki kökenleri ile sıkı bir prosedür olduğunu kastediyordum
ttnphns

3
@ ttphns, "outlier" yerine yazım "outliar" kasıtlı mı, değil mi?
mpiktas

1
İstemsiz yazım hatası.
ttnphns

16

Bu sorunun çok cevabı var. İşte muhtemelen başka bir yerde görmeyeceğinizden biri, bu yüzden buraya ekliyorum çünkü konuyla ilgili olduğuna inanıyorum. İnsanlar genellikle, medyanın aykırı değerlere karşı sağlam bir önlem olarak kabul edildiğinden, çoğu şeyin de sağlam olduğunu düşünür. Aslında, çarpık dağıtımlarda yanlılığa karşı dayanıklı olduğu da düşünülmektedir. Medyanın bu iki sağlam özelliği genellikle birlikte öğretilir. Altta yatan eğri dağılımların da aykırı değerlere sahip gibi görünen küçük örnekler üretme eğiliminde olduğu ve geleneksel bilgeliğin, böyle durumlarda medyan kullandığı söylenebilir.

#function to generate random values from a skewed distribution
rexg <- function (n, m, sig, tau) {
    rexp(n, rate = 1/tau) + rnorm(n, mean = m, sd = sig)
    }

(Bunun çarpık ve temel şekil olduğuna dair bir gösteri)

hist(rexg(1e4, 0, 1, 1))

arsa

Şimdi, bu dağıtımdan çeşitli örneklem büyüklüklerini örneklendirirsek ve medyanı hesaplarsak ve aralarındaki farkların ne olduğunu görmek istersek ne olacağını görelim.

#generate values with various n's
N <- 1e4
ns <- 2:30
y <- sapply(ns, function(x) mean(apply(matrix(rexg(x*N, 0, 1, 1), ncol = N), 2, median)))
plot(ns,y, type = 'l', ylim = c(0.85, 1.03), col = 'red') 
y <- sapply(ns, function(x) mean(colMeans(matrix(rexg(x*N, 0, 1, 1), ncol = N))))
lines(ns,y)

plot2

Yukarıdaki çizimden görülebileceği gibi, ortanca (kırmızı), ortalığa n'den çok daha hassastır. Bu, özellikle dağılımı bükülmüşse, düşük ns'li medyanların kullanılmasıyla ilgili bazı geleneksel bilgeliğe aykırıdır. Ve, ortanca bilinen bir değer olduğu anlamına gelirken, medyan diğer özelliklere duyarlıdır;

Bu analiz Miller, J. (1988) 'e benzer. Medyan reaksiyon zamanı hakkında bir uyarı. Deneysel Psikoloji Dergisi: İnsan Algısı ve Performansı , 14 (3): 539-543.

REVİZYON

Çarpıklık sorununu düşündüğümde, medyan üzerindeki etkinin sadece küçük örneklerde medyanın dağılımın kuyruğunda olma ihtimalinin daha yüksek olması ihtimalinin olabileceğini düşündüm. modu. Bu nedenle, belki de bir kişi aykırı bir olasılıkla örnekleme yapıyorsa, o zaman aynı sonuçlar ortaya çıkabilir.

Bu yüzden aykırı olayların olabileceği durumlar hakkında düşündüm ve deneyciler onları ortadan kaldırmaya çalıştı.

Eğer aykırı değerler, örneğin her veri örneklemesinden birinde olduğu gibi tutarlı bir şekilde gerçekleştiyse, medyanlar bu aykırı etkisine ve medyanların kullanımıyla ilgili konvansiyonel öykünün etkisine karşı sağlamdır.

Ama genellikle işler böyle gitmez.

Bir deneyi çok az sayıda hücrede bir outlier bulabilir ve bu durumda ortalama yerine medyan kullanmaya karar verebilir. Yine, medyan daha sağlamdır, ancak gerçek etkisi göreceli olarak düşüktür çünkü çok az aykırı değer vardır. Bu, kesinlikle yukarıdakilerden daha yaygın bir durum olacaktır, ancak medyan kullanmanın etkisi muhtemelen çok da önemli olmayacaktı.

Muhtemelen daha yaygın aykırı değerler, verilerin rastgele bir bileşeni olabilir. Örneğin, popülasyonun gerçek ortalama ve standart sapması yaklaşık 0 olabilir, ancak ortalamanın 3 olduğu bir dışlayıcı popülasyondan örnekleme zamanımızın bir yüzdesi vardır. Bu tür bir popülasyonun numuneyi değiştirdiği örneklemin bulunduğu aşağıdaki simülasyonu göz önünde bulundurun boyut.

#generate n samples N times with an outp probability of an outlier.
rout <- function (n, N, outp) {
    outPos <- sample(0:1,n*N, replace = TRUE, prob = c(1-outp,outp))
    numOutliers <- sum(outPos)
    y <- matrix( rnorm(N*n), ncol = N )
    y[which(outPos==1)] <- rnorm(numOutliers, 4)
    return(y)
    }

outp <- 0.1
N <- 1e4
ns <- 3:30
yMed <- sapply(ns, function(x) mean(apply(rout(x,N,outp), 2, median)))
var(yMed)
yM <- sapply(ns, function(x) mean(colMeans(rout(x,N,outp))))
var(yM)
plot(ns,yMed, type = 'l', ylim = range(c(yMed,yM)), ylab = 'Y', xlab = 'n', col = 'red') 
lines(ns,yM)

Sonuçlar

Ortanca kırmızıdır ve siyahtır. Bu, çarpık bir dağılımınkine benzer bir bulgudur.

Aykırı değerlerin etkilerinden kaçınmak için medyanların kullanımına ilişkin nispeten pratik bir örnekte, medyan kullanıldığında tahminin n'den daha fazla etkilendiği durumlar ortaya çıkmaktadır.


Güzel bir örnek, ama gerçekten dağılıma bağlı. Normal bir dağılım veya düzgün bir dağılım kullanıyorsanız, grafik çok farklıdır, iki satır üst üste bindirilir. Fark yaratan üstel dağılım.
nico,

1
-1 Bu cevap "hassasiyet" i "önyargı" ile karıştırır.
whuber

4
Çok daha iyi; Olumsuz oyu kaldırdım. Ancak yeni açıklama ilgimi çekiyor: “[medyan] 'ın çarpık dağıtımlarda yanlılığa karşı dayanıklı olduğu düşünülüyor” iddiasını ortaya koyan bir kaynak gösterebilir misiniz? bu ne anlama geliyor? Daha önce böyle bir iddiaya rastlamadım ve gerçekte ne söylediğinden emin değilim.
whuber

3
Psikoloji araştırmalarında tepki süreleriyle (eğri olduğu bilinen) başa çıkmak için daha fazla halk bilgisi var. Psikolojide halk bilgeliğini çürüten bir makaleye atıfta bulundum (daha önce atıfta bulunmadığım için kötü hissediyorum).
John

3
BTW, Miller (1988) 'e rağmen kâğıt insanlar, koşulların farklı sayıda örneğe sahip olduğu ve düşük olanın genellikle oldukça küçük olduğu olasılık manipülasyonları ile ilgili çalışmalarda hala medyan reaksiyon sürelerini kullanmaktadır.
John

11
  • Tüm öğelerin toplamını hesaplamak kolaydır; örneğin, nüfusun ortalama gelirini ve nüfusun büyüklüğünü biliyorsanız, derhal tüm nüfusun toplam gelirini hesaplayabilirsiniz.

  • Ortalama, O(n)zaman karmaşıklığında hesaplamak için basittir . Medyanı lineer zamanda hesaplamak mümkündür ancak daha fazla düşünce gerektirir. Sıralama gerektiren açık çözüm, O(n log n)zamanın karmaşıklığını daha da kötüleştiriyor .

Ve ortalamanın medyandan daha popüler olmasının başka bir nedeni olduğunu düşünüyorum:

  • Ortalama okulda daha fazla kişiye öğretilir ve muhtemelen ortanca öğretmeden önce öğretilir

Zaman karmaşıklığınız için değerlerin nasıl depolandığına bağlıdır. Değerler zaten sıralanırsa, O (1) en kötü durum zaman karmaşıklığında medyanı hesaplamak kesinlikle mümkündür.
luiscubal

Katılıyorum - toplamlar gibi hesaplamalarda uygulanabilirliği, ortalamanın temel avantajlarından biridir. Amaç bir şeyi tanımlamak için sıklıkla medyanı tercih etsem de, başka bir hesaplamaya girdi olduğunda sık sık ortalamayı kullanırız.
Jonathan,

5

"Medyan'ın aykırı maddelere karşı dirençli olduğu biliniyor. Bu durumda, ortalamayı ne zaman ve neden kullanalım?"

Birinin bildiği durumlarda aykırı değer yoktur, örneğin biri veri üretme sürecini bilir (örneğin matematiksel istatistiklerde).

Kişi önemsizdir, bu iki niceliğin (ortalama ve ortanca) aslında aynı şeyi ölçmemesi ve çoğu kullanıcının eskisi ile gerçekten ilgilenmesi gerekenleri ne zaman ilkine sormaları gerektiğine işaret etmelidir. Ortanca tabanlı Wilcoxon testleri, t testlerinden daha kolay yorumlanmaktadır).

Daha sonra, bazı sebep sebepleri veya başka sebeplerden dolayı, bazı düzenlemelerin, demek istediğini kullandığı durumlar vardır.


2

Bu endişe aykırı değerlerin varlığından büyükse, verilerinizi kontrol etmenin bazı basit yolları vardır.

Aykırı değerler, neredeyse tanım gereği, verileri üreten süreçte veya veri toplama sürecinde bir şey değiştiğinde verilerimize gelir. yani veriler homojen değildir. Verileriniz homojen değilse, ne ortalama ne de medyan anlamlı değildir, çünkü birbirine karıştırılmış iki ayrı veri setinin merkezi eğilimini tahmin etmeye çalışıyorsunuzdur.

Homojenliği sağlamak için en iyi yöntem, tüm verilerinizin tek bir süreç kümesinden gelmesini sağlamak için veri üreten ve toplama süreçlerini incelemektir. Burada hiçbir şey biraz beyin gücünü yenemez.

İkincil bir kontrol olarak, birkaç istatistiksel testten birine başvurabilirsiniz: ki-kare, Dixon'ın Q-testi, Grubb testi veya kontrol çizelgesi / işlem davranış çizelgesi (tipik olarak X-bar R veya XmR). Tecrübelerime göre, verileriniz toplandığı şekilde sipariş edilebiliyorsa, işlem davranış çizelgeleri aykırı değerlerin tespitinde dışlayıcı testlerden daha iyidir. Grafikler için bu kullanım biraz tartışmalı olabilir, ancak tamamen Shewhart'ın orijinal amacı ile tutarlı olduğuna ve açıkça Donald Wheeler tarafından savunulan bir kullanım olduğuna inanıyorum . Aykırı değer testlerini veya işlem davranışı çizelgelerini kullansanız da, tespit edilen bir "aykırı" nın yalnızca potansiyel olarak sinyal verdiğini unutmayındaha fazla incelenmesi gereken homojen olmama. Neden outlier olduklarına dair bir açıklamanız yoksa, veri noktalarını atmak nadiren mantıklıdır.

R kullanıyorsanız, outliers paketi outliers testlerini sağlar ve proses davranış çizelgeleri için qcc , IQCC ve qAnalyst vardır. Qcc paketinin kullanımı ve çıktısı için kişisel bir tercihim var.


2

Ne zaman demek istersin?

Finanstan örnekler:

  • Tahvil iadeleri:
    • Ortanca bono getirisi genellikle birkaç yüzde puan olacaktır.
    • Ortalama tahvil getirisi, varsayılan değere ve varsayılan olarak iyileşmeye bağlı olarak düşük veya yüksek olabilir. Medyan bütün bunları görmezden gelecek!
    • Yatırımcılarınıza açıklamasında iyi şanslar, "Biliyorum bu yıl fonumuz% 40 düştü çünkü tahvillerin neredeyse yarısı tahsil edilmeden kaldı, ancak medyan tahvilimiz% 1 döndü!"
  • Risk sermayesi iadeleri:
    • Tersi aynı şey. Ortanca VC ya da melek yatırımı büstür ve tüm kazançlar bir kaç kazanandan gelir! (Yan not / uyarı: risk sermayesi veya özel sermaye getirisi tahminleri oldukça sorunludur ... dikkatli olun!)

Çeşitlendirilmiş bir portföy oluştururken, neye yatırım yapacağınıza ve ne kadara karar vereceğinize karar verdiğinizde, getirilerin ortalama ve kovaryansı optimizasyon probleminizi belirgin şekilde etkileyecektir.


Kabul edildi, ancak ortalamanın ya da medyanın bu durumların hiçbirinde odaklanmadığı görülüyor: bunun yerine toplamların kilit miktarlar olabileceği kesin. Doğal olarak bu, medyanlardan daha iyi özetler anlamına gelir. Ancak, medyan tahvil getirisinin aptalca bir cevap olabileceği kabul edilir, ancak bunu öneren var mı?
Nick Cox

@NickCox İki yorum. (1) Medyan tahvil getirisinin aptalca olduğu nokta bu! Bu cevaplarda harika bir teori var, ama son derece basit bir örneğin biraz renk katabileceğini düşündüm. Frank'in cevabını alıntılamak için, "ortalama, verilere duyarlı olduğu için kullanılır" ve portföy iadeleri, istediğiniz yerde basit, anlaşılabilir bir durum verir. (2) “Toplam” ı umursamakla “ortalama” ı umursamak arasındaki fark oldukça muğlak olabilir. “Riskten korunma fonuna yatırım yapmalı mıyım?” Buna cevap vermek için, belki de "Riskten korunma fonlarının ortalama getirisi nedir?" Bilmek isterim.
Matthew Gunn,

1
(1) dediğim gibi katılıyorum; Benim sorum sadece medyanın bu amaçla öğretim ya da araştırma literatüründe ciddi olarak bahsedilmiş olup olmadığıdır. (2) Amacımın berbat olduğunu düşünmüyorum; Bu, neyin önce geldiğine dair basit bir sorudur, yani pratikte birincil ilgi alanıdır. "Toplam 200 yıl hapis yatar" başlıklarını görüyorum ve neden basıldıklarını biliyorum, ancak yine de özetlemenin tuhaf bir yolu. Buna karşılık, bir dizi felakette öldürülen 200, her birinde ortalama 40 ölümle sonuçlanan 5 felaketten daha birincildir. (Küçük) meselesi, hangi özet ifadesinin en uygun olduğunu seçmektir.
Nick Cox

@NickCox Noktası alındı. Kendi yatırımlarınızın toplamını umursamanıza katılıyorum. Bir portföy oluştururken ve portföyün belirlenmesinde belirli menkul kıymetlerin ağırlığına karar verirken, söz konusu güvenliğin getirisinin özelliklerini koruyacaksınız. Belediye bonolarını TÜM almayacağım, doğrudan toplamı umursamıyorum ama belediye tahvilinin ortalama getirisi ne kadar umrumda mı? Portföyüme birkaç tane eklersem, risk / getiri özellikleri nelerdir?
Matthew Gunn

Kabul. Burası bölge.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.