Medyan, bir tür “ortalama” genellemesi için bir tür ortalama mıdır?


20

"Ortalama" kavramı geleneksel aritmetik ortalamadan çok daha geniştir; medyanı içerecek kadar uzar mı? Kıyas yoluyla,

raw dataidraw datameanraw meanid1arithmetic meanraw datarecipreciprocalsmeanmean reciprocalrecip1harmonic meanraw dataloglogsmeanmean loglog1geometric meanraw datasquaresquaresmeanmean squaresquare1root mean squareraw datarankranksmeanmean rankrank1median

Çizdiğim benzetme, şu şekilde verilen yarı aritmetik ortalamaya yöneliktir :

Mf(x1,,xn)=f1(1ni=1nf(xi))

Karşılaştırma için, beş maddelik bir veri kümesinin medyanının üçüncü öğeye eşit olduğunu söylediğimizde, verileri bir ila beş arasında sıralamaya eşdeğer olarak görebiliriz (ki bir fonksiyonu ile gösterebiliriz ); dönüştürülen verilerin (üç olan) ortalamasını almak; ve üç rütbesi olan (bir tür ) veri öğesinin değerinin okunması .f - 1ff1

Geometrik ortalama, harmonik ortalama ve RMS, örneklerinde, herhangi bir sayıya izole olarak uygulanabilen sabit bir işlevdi. Buna karşılık, bir rütbe atamak veya rütbelerden orijinal verilere geri dönmek için (gerektiğinde enterpolasyon) tüm veri kümesinin bilgisi gerekir. Ayrıca, yarı aritmetik ortalamayı okuduğum tanımlarda, sürekli olması gerekir. Medyan şimdiye kadar özel bir yarı-aritmetik ortalama örneği olarak kabul edilir mi ve eğer öyleyse nasıl tanımlanır? Yoksa medyan daha önce başka bir “ortalama” kavramının bir örneği olarak mı tanımlanıyor? Yarı aritmetik ortalama mevcut tek genelleme değildir.f ffff

Konunun bir kısmı terminolojiktir (özellikle "merkezi eğilim" veya "ortalama" nın aksine "ne demek" ne anlama geliyor?). Örneğin, bulanık kontrol sistemleri literatüründe , bir toplama fonksiyonu , ve ile artan bir fonksiyondur. ; [a, b] içindeki tüm x, y \ için "toplama" (a Genel anlamda). Böyle bir tanım, söylemeye gerek yok, inanılmaz geniş! Ve bu bağlamda medyan gerçekten de bir tür ortalama olarak adlandırılır. ^ {[1]}F:[a,b]×[a,b][a,b]F(a,a)=aF(b,b)=bmin(x,y)F(x,y)max(x,y)x,y[a,b][1]Ancak, ortalamanın daha az geniş karakterizasyonlarının hala medyanı kapsayacak kadar genişleyip genişlemediğini merak ediyorum - genelleştirilmiş ortalama ("güç ortalaması" olarak daha iyi tanımlanabilir) ve Lehmer ortalaması değil, ama diğerleri . Değeri ne olursa olsun, Wikipedia "medyan" ı "diğer araçlar" listesine ekler , ancak daha fazla yorum veya alıntı yapmaz.

[1] : İkiden fazla girdi için uygun şekilde uzatılmış bu kadar geniş bir ortalama tanım, bulanık kontrol alanında standart gibi görünmektedir ve medyan olarak tanımlanan medyan örnekleri için internet aramaları sırasında birçok kez kırpılmıştır; Örneğin Fodor, JC ve Rudas, IJ (2009), " Göç Eden Bazı Toplama İşlev Sınıflarında ", IFSA / EUSFLAT Conf. (sayfa 653-656). Bu arada, bu kağıt notlar terimi "demek" (en erken kullanıcılarından biri olduğunu moyenne ) idi Cauchy , içinde Cours d'analiz de l'Ecole royale yüksekokul, 1ère partie; Analiz et: algébrique (1821). Daha sonra katkıları Aczél , Chisini ,ve de Finetti, Cauchy'den daha genel "ortalama" kavramları geliştirmede Fodor, J. ve Roubens, M. (1995), "Ortalamaların anlamlılığı üzerine ", Hesaplamalı ve Uygulamalı Matematik Dergisi , 64 (1), 103-115.


Sanırım aritmetik ortalama, medyan ve mod cevher genellikle "ortalama" olarak adlandırılır ve kelime bazen belirsiz bir şekilde kullanılır. İstatistiklerle Yalan söylemek kitabı, bunu istatistiklerle "yalan söyleme" örneği olarak kullanır. (Sorunuzun daha genel olduğunu anlıyorum, bu yüzden yorum olarak gönderin.)
Tim

@Tim "Mod" un "ortalama" olarak adlandırıldığını görmenin nadir olduğuna dair bilimsel olmayan bir izlenim var. Ancak kesinlikle "ortalama" (bazen "aritmetik ortalama" ile eşanlamlı olarak kullanılır) ve diğer zamanlarda hiçbir anlam ifade etmeyen merkezi eğilim ölçülerini içeren büyük bir kafa karışıklığı bağı vardır ve "ortalama" ( teknik anlamda değil genel kullanım çoğunlukla "sadece aritmetik ortalama" için kullanılır). Bu arada "demek" diğer anlamları nedeniyle, internet aramaları için de zor bir konu !
Silverfish

3
ortalamalar (aritmetik, geometrik, harmonik, enerjili, üstel, kombinatoryal vb.) "analitik ortalamalar" dır. Ortanca, kantil, tantan "ortalama ortalamalar" dır. Sıralama, log, kare vb.'den oldukça farklıdır, çünkü herhangi bir değişkenin tekdüze değişime monotonik dönüşümüdür ve dönüştürülecek geri yol yoktur.
ttnphns

Btw "genelleştirilmiş ortalama" terimi
enrwupied

3
hesaplamalarında ağırlıklara izin verirseniz , medyan kolayca bir tür ortalama olarak kabul edilebilir. Benzer şekilde, ama aynı değil, kesilmiş araçlar kavramı kesinlikle sınırlayıcı veya nezaket özel bir durum olarak medyanları içerir. stata-journal.com/article.html?article=st0313 oldukça yeni bir inceleme. iwixi,iwi=1
Nick Cox

Yanıtlar:


9

İşte bir medyanı "genel bir tür ortalama" olarak görmenin bir yolu - ilk olarak, sıradan aritmetik ortalamanızı sipariş istatistikleri açısından dikkatlice tanımlayın:

x¯=iwix(i),wi=1n.

Sonra sıradan ortalama istatistiklerini başka bir ağırlık fonksiyonu ile değiştirerek, siparişi açıklayan "genelleştirilmiş ortalama" kavramını elde ederiz.

Bu durumda, bir dizi potansiyel merkez önlemi "genelleştirilmiş araç türleri" haline gelir. Tek için medyan durumunda, , w ( n + 1 ) / 2 = 1 ve tüm diğer 0 ve hatta için , n , W , nnw(n+1)/2=1n .wn2=wn2+1=12

Benzer şekilde, M-tahminine bakarsak , konum tahminleri de aritmetik ortalamanın genelleştirilmesi olarak düşünülebilir (ortalama için kuadratik, ψ doğrusal veya ağırlık fonksiyonu düzdür) ve medyan bu genelleme sınıfına da girer. Bu, öncekinden biraz farklı bir genelleme.ρψ

Medyanı içerebilecek 'ortalama' kavramını genişletebilmemizin başka yolları da vardır.


Bu çok güzel. Bu cevapla yakından ilişkili olan ve soruda belirtilen makalelerde tartışılan: sipariş edilen ağırlıklı ortalama veya OWA
Silverfish

11

Ortalamayı, kuadratik kayıp fonksiyonu SSE'yi en aza indiren nokta olarak düşünüyorsanız, medyan doğrusal kayıp fonksiyonu MAD'yi en aza indiren noktadır ve mod, 0-1 kayıp fonksiyonunu en aza indiren noktadır. Dönüşüm gerekmez.

Bu yüzden medyan bir Fréchet ortalamasına bir örnektir .


3
@Mike Anderson: Bu, medyanın Frechet ortalaması olduğunu gösteriyor (wikipedia makalesine bakın): en.wikipedia.org/wiki/Fr%C3%A9chet_mean
kjetil b halvorsen

@Kjetil Mükemmel! Medyanın bir Fréchet ortalamasının örneği olması benim sorumun cevabıdır "şimdiye kadar" medyan "? Ve Mike Anderson'a +1. Umarım bu bilgi cevapta düzenlenir.
Silverfish

2
@ Kjetil'in cevabına yaptığı yorumu ekledim, böylece "Frechet mean" için bir site aramasında görünecek. İkinize de teşekkürler.
Silverfish

4

Bir kolay ancak verimli genelleme için ağırlıklı vasıtasıyla , burada Σ n i = 1 w i = 1 . Açıkça görülüyor ki, ortak veya bahçe ortalaması, eşit ağırlıklara w i = 1 / n olan en basit özel durumdur .i=1nwixi/i=1nwi,i=1nwi=1wi=1/n

Ağırlıklar, en küçükten en büyüğe, büyüklükteki değerlerin sırasına, diğer çeşitli özel durumlara, özellikle de diğer isimler tarafından da bilinen kesilmiş bir ortalama fikrine bağlıdır .

Notasyonun gerekli olmadığı veya özellikle yararlı olmadığı yerlerde aşırı kullanımdan kaçınmak için, örneğin en küçük ve en büyük değerleri görmezden geldiğini ve diğerlerinin (eşit ağırlıklı) ortalamasını aldığını düşünün. Ya da en küçüğü ve en büyüğünü görmezden geldiğini ve diğerlerinin ortalamasını aldığını düşünün; ve benzerleri. En güçlü kırpma, değerlerin sayısının tek mi yoksa çift mi olduğuna bağlı olarak, bir veya iki orta değer dışındaki tüm değerleri göz ardı eder, ki bu doğal olarak sadece tanıdık medyandır . Kırpma fikrindeki hiçbir şey sizi bir numunenin her kuyruğundaki eşit sayıları görmezden gelmekten alıkoyamaz, ancak asimetrik kırpma hakkında daha fazla şey söylemek bizi bu iş parçasındaki ana fikirden uzaklaştıramaz.

Kısacası, araçlar (niteliksiz) ve medyanlar (simetrik) kesilmiş araç ailesinin aşırı sınırlayıcı durumlarıdır. Genel fikir, verilerdeki tüm bilgileri kullanma idealiyle, kendisini güvenilir olmayan aykırı olabilecek aşırı veri noktalarından korumak için başka bir ideal arasındaki uzlaşmaya izin vermektir.

Oldukça yeni bir inceleme için buradaki referansa bakın .


4

Güç araçları, - Soru davetiye hepimizi normal yollarla kapsayacak şekilde yeterince geniş anlamda "ortalama" kavramını karakterize etmek veri analizi için neredeyse işe yaramaz hale gelmesi ama bu kadar geniş - araçları, medyanları, kesilmiş demektir . Bu cevap, "ortalama" nın herhangi bir makul yararlı tanımına sahip olması gereken aksiyomatik özelliklerin bazılarını tartışmaktadır.Lp


Temel Aksiyomlar

Veri analizi amacıyla "ortalama" bir amaca uygun geniş tanımı herhangi bir iyi tanımlanmış, belirleyici fonksiyon dizisi olacaktır için bir R ve n = 1 , 2 , ... , öyle kifn:AnAARn=1,2,

(1) için tüm X = ( x , 1 , x 2 , ... , x , n ) A , n , (uç arasında bir ortalama yalan)min(x)fn(x)max(x)x=(x1,x2,,xn)An

(2) , argümanlarının permütasyonları altında değişmezdir (ortalamalar verilerin sırasını umursamamaktadır) vefn

(3) her bir argümanlarının her birinde azalmaz (sayılar arttıkça ortalamaları düşemez).fn

Biz gereken izin tür geometrik aracı olarak vasıtasıyla, bol ancak böyle kümeler üzerinde tanımlı olduğundan (tüm pozitif sayılar gibi) gerçek sayıların bir öz alt kümesidir olmak.A

Bunu da eklemek isteyebiliriz

(1 '), min ( x ) f n ( x ) maks ( x ) (ortalamalar aşırı değildir ) olan en azından bir miktar vardır. (Bunun her zaman beklemesini isteyemeyiz. Örneğin, ( 0 , 0 , , 0 , 1 ) medyanı minimum olan 0'a eşittir .)xAmin(x)fn(x)max(x)(0,0,,0,1)0

Bu özellikler, bir dizi (sıralanmamış) verinin bir tür "orta değeri" olan "ortalama" olmanın arkasındaki fikri ele almaktadır.

Tutarlılık aksiyomları

Daha az belirgin olan tutarlılık ölçütünü şart koşuyorum

fn+1(t,x1,x2,,xn)t[min(x),max(x)]fn(x)tveri kümesine. (3) ile bağlantılı olarak, bir veri kümesine bitişik uç değerlerin ortalamayı bu uç noktalara doğru çekeceğini ima eder.

Ortalama kavramını bir dağıtıma veya "sonsuz nüfusa" uygulamak istiyorsak, keyfi yollardan rasgele büyük örneklerin sınırına ulaşmanın bir yolu olurdu. Elbette sınır her zaman mevcut olmayabilir (örneğin, dağılımın beklentisi olmadığı zaman aritmetik ortalama için mevcut değildir). Bu nedenle, bu tür sınırların varlığını garanti etmek için herhangi bir ek aksiyom dayatmak istemiyorum, ancak aşağıdakiler doğal ve yararlı görünüyor:

AxnFAfn(xn)A

Aynı çizgiler boyunca, örnek boyutları arttıkça "konum" un daha iyi bir tahmincisi olması konusunda ısrar etmek için bir ortalama fikri daha da daraltabiliriz:

Afn(X(n))X(n)=(X1,X2,,Xn)Fn

Süreklilik aksiyomu

Verilerle "güzelce" değişmek için araçlar istemeyi düşünebiliriz:

fn

Bu gereklilik bazı garip genellemeleri ortadan kaldırabilir, ancak iyi bilinen herhangi bir anlamı dışlamaz. Bazı toplama işlevlerini ekarte eder.

Değişmez aksiyom

Araçları, aralık veya oran verilerine (Stevens'ın iyi bilinen anlamında) uygulanacak şekilde düşünebiliriz. Biz onlar (geometrik ortalama değildir) yerin vardiya altında değişmeyen olmak talep olamaz, ama biz olabilir gerektirir

fn(λx)=λfn(x)xAnλ>0λxAnfn

Soruda bahsedilen tüm araçlar, bazı toplama işlevleri dışında bu aksiyomu tatmin eder.


Tartışma

f2n>2

Her zamanki örnek medyan tüm bu aksiyomatik özelliklere sahiptir.

Tutarlılık aksiyomlarını içerecek şekilde artırabiliriz

f2n(x;x)=fn(x)xAn.

100α% 100α%(1,2,3,6)(2,2,3,3)2.5(1,1,2,2,3,3,6,6)3.5

Hangi tutarlılık aksiyomlarından (4.a), (4.b) veya (4.c) hangisinin en çok arzu edilen veya yararlı olacağını bilmiyorum. Bağımsız görünüyorlar: İkisinin üçüncüyü ima ettiğini düşünmüyorum.


(+1) Bence (1 '), “anlam aşırılık değildir”, ilginç bir noktadır. Aksi takdirde, ortalamanın birçok doğal tanımı, özel veya sınırlayıcı vakalar olarak minimum ve maksimumları içerir: Bu, güç araçları için geçerlidir , Lehmer , Fréchet ortalaması , Chisini ortalaması ve Stolarsky ortalamasıdır . Yine de "ortalama" olarak adlandırmak biraz garip görünüyor!
Gümüş Balık

Evet, sınırlayıcı durumlar kaçınılmazdır. Ancak sonlu veri kümeleri için, ne maks'in ne de min'in "anlamına geldiği" konusunda ısrar etmek isteyebiliriz.
whuber

Öte yandan, sadece "her zamanki örnek medyan tüm bu aksiyomatik özelliklere sahiptir", ama her zamanki örnek kantil (bir şey kaçırmadım sürece) doğru değil. Ayrıca, üst çeyreğe "ortalama" olarak atıfta bulunmak biraz garip geliyor (çok eğimli verilerde merkezi eğilimin bir ölçüsü olarak kullanıldığını gördüm). Diğer tüm kantilleri kabul edersek, artık minima ve maxima'yı kabul etmek çok da rahatsız edici hissetmiyor. Ama kesinlikle en azından onları dışlama hakkını korumanın istenebileceğini görebiliyorum.
Gümüş Balık

1
Ben araçların panteonuna kantilleri kabul etmekten rahatsız değilim. Sonuçta, verilen dağılım aileleri için, bazı medyan olmayan miktarlar aritmetik yollarla çakışacaktır, bu nedenle bu olasılığı aksiyomatik olarak ortadan kaldırmaya çalıştığınızda sorun yaşayabilirsiniz. (Örneğin, sabit geometrik SD'nin lognormal dağılımları ailesini düşünün.) Aritmetik ortalama ortalama olarak nitelendirilemiyorsa, hepsi kaybedilir!
whuber

1
Cevabımda açıklandığı gibi bu yaklaşımı düşündüm ve reddettim: eğer böyle bir kriteri uygularsanız n>2, medyanı bir tür ortalama olarak ortadan kaldırırsınız!
whuber

2

Bence medyan, aritmetik ortalamanın bir tür genelleştirmesi olarak düşünülebilir. Özellikle, aritmetik ortalama ve medyan (diğerleri arasında) Chisini ortalamasının özel durumları olarak birleştirilebilir. Bir değer kümesi üzerinde bir işlem yapacaksanız, Chisini ortalaması kümedeki tüm orijinal değerlerin yerine geçebileceğiniz ve yine de aynı sonucu elde edebileceğiniz bir sayıdır. Örneğin, değerlerinizi toplamak istiyorsanız, tüm değerleri aritmetik ortalama ile değiştirmek aynı toplamı verir. Fikir, belirli bir değerin, bu sayılar üzerinde belirli bir işlem bağlamında kümedeki sayıları temsil etmesidir. (Bu düşünme biçiminin ilginç bir sonucu, verilen bir değerin - aritmetik ortalama - yalnızca bu rakamlarla belirli şeyler yaptığınız varsayımı altında temsilci olarak kabul edilebileceğidir.)

This is less obvious for the median (and I note that the median is not listed as one of the Chisini means on Wolfram or Wikipedia), but if you were to allow operations over ranks, the median could fit within the same idea.


This is a very interesting suggestion. Could you suggest a suitable operation, so that for a median M we would have f(M,M,...,M)=f(x1,x2,...,xn)?
Silverfish

That's a good question, @Silverfish, I've been thinking about that ;-). My thinking is more that, in your Q & the discussion in comments, the conceptual framework seems to be how to get the mean & how to get the data back from the mean; OTOH, my framing is what we use the mean for: viz as a compressed representation of the data w/ the minimum information loss.
gung - Reinstate Monica

I've added some citations to the question which show a wider range of conceptual frameworks, including this one. At the moment I can't see a better f than "take the median", which doesn't quite seem within the spirit of the piece!
Silverfish

@Silverfish, I grant that does seem like a somewhat problematic hole in my position.
gung - Reinstate Monica

While the insight from Chisini's set-up is that, for example, the arithmetic mean preserves the sum, while the geometric mean preserves the product, it's still true (just less interesting) that the arithmetic mean of (x¯,x¯,...,x¯) is also x¯ and so on. So I'm not convinced it's a fatal blow.
Silverfish

-1

The question is not well defined. If we agree on the common "street" definition of mean as the sum of n numbers divided by n then we have a stake in the ground. Further If we would look at measures of central tendency we could say both Mean and Median are generealization but not of each other. Part of my background is in non parametrics so I like the median and the robustness it provides, invariance to monotonic transformation and more. but each measure has it's place depending on objective.


2
Welcome to our site, Bob. I believe that if you read to the end of the question--especially the long penultimate paragraph--you will discover that it is precise and well-defined. (If not, it would be a good idea to explain what you mean by "not well defined.) Your comments don't really seem to address what is being asked.
whuber

1
I actually sympathise with Bob's feeling that the question is not terribly well-defined, in the sense that the concept of "mean" does not have a single definition, but I have tried my best to make things as clear as possible. I hope my most recent edit helps clarify things.
Silverfish

1
The reason I feel the question has some value other than mere terminology (what does mean mean anyway, and is there a definition we can stretch as far as to include the median?) is that it may be instructive to see the median as just one member of a family of generalizations of the mean; Nick Cox's example of the median as a limiting case of the trimmed mean is particularly nice - it ties in neatly with the "robustness" property you like. In the family of trimmed means, the "street" arithmetic mean and the median lie at opposite ends with a spectrum between them.
Silverfish
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.