Hangi "ne zaman" kullanmak demek?


197

Yani aritmetik ortalama (AM), geometrik ortalama (GM) ve harmonik ortalama (HM) var. Onların matematiksel formülasyonları da ilişkili kalıplaşmış örnekleri ile birlikte iyi bilinmektedir (örneğin, Harmonik ortalama ve bununla ilgili problemleri hızlandırmak için uygulanması).

Bununla birlikte, beni her zaman ilgilendiren bir soru, "belirli bir bağlamda kullanmak için en uygun olanın ne anlama geldiğine nasıl karar verebilirim?" Uygulanabilirliği anlamaya yardımcı olmak için en azından bazı kurallar olmalı ve yine de karşılaştığım en yaygın cevap: “Bu değişir” (ama ne?).

Bu oldukça önemsiz bir soru gibi görünebilir, ancak lise metinleri bile bunu açıklayamadı - sadece matematiksel tanımlamalar yapıyorlar!

Matematiksel bir ders yerine İngilizce açıklamayı tercih ederim - basit bir test "annen / çocuğunuz bunu anlar mı?" Olurdu.


20
Bu belki de fazla basitleştiriyor ancak ben her zaman çeşit ve gözlem kullandım. Aralık aynıysa = AM (puanları 0-100, 0-100 arası), aralık farklıysa ancak gözlem aynıysa = GM (puanları 1-5 ila 0-10 arası olanları karşılaştırın), aralık aynıysa ancak gözlemler farklıdır = HM (farklı hızlarda bir arabanın hızı, iki merdivenin yüksekliği, diğer "oranlar").
Brandon Bertelsen

> "Bağlıdır" (fakat neye göre?) Veri işleme algoritmasına bağlıdır.
Macson

Kullanması gereken sadece bir seçenek değil. Aynı zamanda, ilgilenilen nüfusu veya süreci tanımlamak için hangi özet istatistik kümesinin seçileceği bir seçimdir. İnsan, gerekli olan tek şeyin, belki de karmaşık bir şeyi tanımlamak için tek bir sayı olduğunu düşünmemelidir.
JimB

Yanıtlar:


160

Bu cevap, aradığınızdan biraz daha fazla matematiksel bükülmüş olabilir.

Anlaşılması gereken önemli nokta olduğunu bütün bu araçların sadece aritmetik ortalamasıdır kılık .

Üç ortak yoldan (aritmetik, geometrik veya harmonik) hangisinin (eğer varsa!) "Doğru" ortalamasının tespit edilmesindeki önemli karakteristik, eldeki sorudaki "ilave yapıyı" bulmaktır.

Başka bir deyişle , "ölçüler" olarak adlandıracağım ve bu terim tutarlılık uğruna biraz daha kötüye kullanılan bazı soyut miktarlar verildiğini varsayalım . Bu üç araçlarının her biri, her bir dönüştürücü (1) elde edilebilir bazı içine (2) alan, aritmetik ortalama ve daha sonra (3) geri özgün ölçüm ölçeğine transforme.x i y ix1,x2,,xnxiyi

Aritmetik ortalama : Açıkçası, "kimlik" dönüşümünü kullanıyoruz: . Bu nedenle, (1) ve (3) numaralı adımlar önemsizdir (hiçbir şey yapılmadı) ve .ˉ x A M = ˉ yyi=xix¯AM=y¯

Geometrik ortalama : Burada ilave yapı, orijinal gözlemlerin logaritmaları üzerindedir. Yani, biz almak adımda GM almak için daha sonra (3) biz ters fonksiyonu aracılığıyla geri dönüştürmek ve , yani . log ˉ x G M = exp ( ˉ y )yi=logxilogx¯GM=exp(y¯)

Harmonik ortalama : Burada katkı yapısı üzerinde tersinin bizim gözlemlerin. Yani, , bu nedenle .ˉ x H M = 1 / ˉ yyi=1/xix¯HM=1/y¯

Fiziksel sorunlar, bu genellikle aşağıdaki sürecinde ortaya: Bazı miktar var bizim ölçümleri ile ilgili olarak sabit kalır ve diğer bazı miktarlarda demek . Tutun: Şimdi, şu oyunu oynamak ve sabit ve bazı bulmaya biz değiştirirseniz öyle ki her bireysel gözlemlerin tarafından , ardından "toplam" ilişkisi hala edilir korunmuş .x 1 , ... , x , n z 1 , ... , z , n ağırlık z 1 + + z , n ˉ x x i ˉ xwx1,,xnz1,,znwz1++znx¯xix¯

Uzaklık-hız-zaman örneği popüler gibi görünüyor, o yüzden kullanalım.

Sabit mesafe, değişen zamanlar

Gidilen sabit bir mesafeyi düşünün . Şimdi, bu mesafeyi farklı zamanlarda , süreleriyle . Şimdi oyunumuzu oynuyoruz. Toplam sürenin sabit kalması için bireysel hızlarımızı biraz sabit hız ile değiştirmek istediğimizi varsayalım . Elimizdeki unutmayın , böylece . Biz bunu istiyoruz toplam biz her değiştirdiğinizde ilişkiyi (toplam süresi ve toplam mesafe seyahat) korunmuş tarafından Oyunumuzda. Dolayısıyla, n v 1 , , v n t 1 , , t n ˉ v d - v i t i = 0dnv1,,vnt1,,tnv¯i ( d - v i t i ) = 0 v i ˉ v n d - ˉ v i t i = 0

dviti=0,
i(dviti)=0viv¯T i = d / h i ° h = n
ndv¯iti=0,
ve her beri , bunu ti=d/vi
v¯=n1v1++1vn=v¯HM.

Buradaki "ilave yapı" nın bireysel zamanlara göre olduğunu ve ölçümlerimizin kendisiyle ters ilişkili olduğunu, dolayısıyla harmonik ortalamanın geçerli olduğunu unutmayın.

Değişken mesafeler, sabit zaman

Şimdi durumu değiştirelim. İçin varsayalım örneklerini biz sabit bir zaman seyahat hızları en mesafeleri üzerinde . Şimdi toplam mesafenin korunmasını istiyoruz. Biz ve toplam sistem halinde muhafaza edilmektedir . tekrar oynayarak gibi fakat olduğundan ntv1,,vnd1,,dn

divit=0,
i(divit)=0v¯
i(div¯t)=0,
di=vit
v¯=1nivi=v¯AM.

Burada tutmaya çalıştığımız katkı yapısı, sahip olduğumuz ölçümlerle orantılıdır, bu nedenle aritmetik ortalama uygulanır.

Eşit hacimli küp

Diyelim ki hacmi ile boyutlu bir kutu inşa ettiğimizi ve ölçümlerimiz kutunun yan uzunluklarıdır. Sonra ve aynı hacme sahip bir boyutlu (hiper) bir küp oluşturmak istediğimizi varsayalım . Yani, bireysel yan uzunluklarımızı ortak bir yan uzunluk . Sonra nV

V=x1x2xn,
nxix¯
V=x¯x¯x¯=x¯n.

Bu kolayca almamız gerektiğini gösterir .x¯=(xixn)1/n=x¯GM

Katkı yapısının logaritmalar içinde olduğunu, yani ve soldaki miktarı korumaya çalıştığımızı unutmayın.logV=ilogxi

Eskiden yeni araçlar

Bir alıştırma olarak, ilk örnekte hem mesafeleri hem de zamanları değiştirmenize izin verdiğiniz durumda “doğal” ın ne anlama geldiğini düşünün. Yani, mesafeler , hızlar ve zamanlar . Toplam mesafeyi ve harcanan zamanı korumak ve bunu elde etmek için bir sabit bulmak istiyoruz .v ı t i ° vdivitiv¯

Alıştırma : Bu durumda "doğal" ne demektir?


25
+1 Bu harika bir cevap. Bununla birlikte, bunun önemli bir şekilde eksik olduğunu düşünüyorum: çoğu durumda kullanım hakkı , verilerdeki matematiksel bir yapıdan ziyade cevaplamaya çalıştığımız soruyla belirlenir . Buna iyi bir örnek çevresel risk değerlendirmesinde ortaya çıkar: düzenleyici otoriteler bir popülasyonun zaman içinde kirletici maddelere toplam maruziyetini tahmin etmek ister. Bu gerektiren , uygun bir şekilde ağırlıklı aritmetik çevre konsantrasyon verileri, genellikle bir olsa bile, ortalama çarpımsal yapısı. Geometrik ortalama, yanlış tahmin edici veya tahmin edici olacaktır.
whuber

7
@whuber: (+1) Bu mükemmel bir yorumdur. Bir cevap oluşturma yolunda, kesinlikle istatistiksel olmayan bir çatal aldım, bu yüzden bundan bahsettiğinize sevindim. Bu tam bir cevaba layık bir konu ( ipucu ).
kardinal

9
@whuber: Ayrıca (belki de istemeyerek), istatistiksel analizin zaman zaman kendi alanı için anlamlı bir şey tahmin etmek isteyen ancak neredeyse uzman olmayan kişilerin bile etki alanı uzmanlarının gözetimine maruz kalabileceği gerçeğini ortaya koymaktadır. tamamen doğal olmayan istatistiksel olarak. Geçmişte orada karşılaştığım mesele, bazen istatistiksel tahminin gerçekleştirilme şeklini de dikte etmek istemeleridir! :)
kardinal

1
@whuber: Bu bakış açısını, cevabınıza biraz da özenle ekleyebilseniz çok sevinirim. Açıkçası, açıklamaların Stats.Se gördüm en iyilerinden biridir!
Doktora

3
@Whuber'dan gelen olağan harika yorum. Bazen (belki de sık sık!) Kullanma hakkı yoktur ; bunun yerine, sorunun genellikle “hangi eğilim eğilim ölçüsünü kullanmalıyım?” ile genişletilmesi gerekir.
Peter Flom

43

@Brandon 'un mükemmel yorumuna göz atarak (ki bunun cevap vermeye teşvik edilmesi gerektiğini düşünüyorum):

Çarpımsal farklarla ilgileniyorsanız geometrik ortalama kullanılmalıdır. Brandon, aralıkların farklı olduğu durumlarda geometrik ortalamanın kullanılması gerektiğini not eder. Bu genellikle doğrudur. Bunun nedeni aralıkları eşitlemek istiyoruz. Örneğin, üniversite adaylarının SAT puanı (0 ila 800), HS (0 ila 4) not ortalaması ve müfredat dışı etkinlikler (1 ila 10) olarak değerlendirildiğini varsayalım. Eğer bir kolej bunları ortalamalandırmak ve aralıkları eşitlemek istiyorsa (yani, aralığa göre her kalitedeki ağırlık artar), geometrik ortalama gitmek için yol olacaktır.

Ancak farklı aralıklardaki terazilerimiz olduğunda bu her zaman doğru değildir . Farklı ülkelerdeki (fakir ve zengin olanlar dahil) gelirleri karşılaştırıyor olsaydık, muhtemelen geometrik ortalamayı değil, aritmetik ortalamayı (veya daha büyük olasılıkla, medyanı veya belki de kesilmiş bir ortalamayı) isterdik.

Harmonik ortalama için gördüğüm tek kullanım oranları karşılaştırmaktır. Örnek olarak: Eğer 40 MPH Boston New York'tan sürücü ve sonra genel ortalama, 60 MPH de dönmek değil 50 MPH aritmetik ortalama, ama harmonik ortalama.

AM = HM =2 / ( 1 / 40 + 1 / 60 ) = 48(40+60)/2=502/(1/40+1/60)=48

Bunun bu basit örnek için doğru olduğunu kontrol etmek için, NYC'den Boston'a 120 mil olduğunu hayal edin. Daha sonra oradaki sürücü 3 saat sürer, eve 2 saat sürer, toplam 5 saattir ve mesafe 240 mildir. 240/5=48


3
SAT / GPA / müfredat dışı örneğiniz neden ağırlıklı veya ölçeklenmiş bir aritmetik ortalama yerine geometrik bir ortalama kullanıyor? Neden bir SAT veya GPA sıfır, diğer iki değerin alakasız hale geldiği anlamına gelsin (geometrik bir ortalama olduğu gibi)? Peki ya (örneğin) ders dışı etkinlikler, teorik menzilinden daha dar bir bantta kümelenme eğilimindeyse? Yüzdeliklerin aritmetik ortalamasını (veya diğer düzeltilmiş değerleri) almanın geometrik değerlerin geometrik ortalamasından daha anlamlı olacağı görülmektedir.
ruakh

1
@ruakh İlginç. Bu durumda 0 sayısının önemi yoktur, çünkü SAT ve GPA gerçekten 0 olamaz (SAT = 0 neredeyse imkansızdır ve 0 not ortalaması mezun olmaz). Yüzdeliklerin aritmetik ortalaması, sonuçlarında (gerçek sayılarda olmasa da) geometrik ortalamaya yakın olacağını düşünüyorum.
Peter Flom

31

Ben onu 3-4 kuralya indirmeye çalışacağım ve Pisagor araçlarından bazı örnekler sunacağım.

3 araç arasındaki ilişki , bazı değişkenli negatif olmayan veriler için HM <GM <AM'dir . Örnek verilerde hiçbir değişiklik yoksa ve bunlar eşit olacaktır.

Seviyelerdeki veriler için AM kullanın. Fiyatlar iyi bir örnektir. Oranlar için GM'yi kullanın. Yatırım iadeleri, Bloomberg Billy endeksi (ABD'deki fiyatlara kıyasla çeşitli ülkelerde Ikea'nın Billy kitaplık fiyatı) ve BM İnsani Gelişme Endeksi gibi göreceli fiyatlar örnek olarak verilebilir. HM, oranlarla uğraşırken uygundur. İşte otomotiv dışı bir örnek David Giles'in izniyle :

Örneğin, "haftada çalışılan saatler" (oran) hakkındaki verileri göz önünde bulundurun. Her biri toplam 2,000 saat çalışan dört kişinin (örnek gözlemler) olduğunu varsayalım. Ancak, aşağıdaki gibi, haftada farklı saatlerde çalışırlar:

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

Üçüncü sütundaki değerlerin Aritmetik Ortalaması AM = haftada 42,5 saattir. Ancak, bu değerin ne anlama geldiğine dikkat edin. Örnek üyelerin (8.000) çalıştığı toplam hafta sayısını bu ortalama değere bölmek, dört kişinin de çalıştığı toplam hafta sayısı olarak 188.2353 değerini verir.

Şimdi yukarıdaki tablodaki son sütuna bakın. Aslında, örnek üyeler tarafından çalışılan toplam hafta sayısı için doğru değer 191.5873 haftadır. Tablonun üçüncü sütununda Harmonik Ortalamayı Haftalık Saat değerleri için hesaplarsak, HM = 41.75642 saat (<AM) alırız ve bu sayının 8.000 saate bölünmesi, toplam sayı için 191.5873'ün doğru sonucunu verir. hafta çalıştı. Harmonik Ortalamanın örnek ortalama için uygun ölçü sağladığı durum budur.

David ayrıca enflasyonu ölçmek için kullanılan fiyat endekslerinde ortaya çıkan 3 aracın ağırlıklı versiyonunu da tartışıyor.

Bir Hijacky Kenara:

Bu ROT'lar mükemmel değil. Mesela, sık sık bir şeyin oran mı, oran mı olduğunu anlamanın zor olduğunu düşünüyorum. Bir yatırımın geri dönüşleri genellikle ortalamaları hesaplarken bir oran olarak değerlendirilir, ancak bunlar genellikle "zaman başına% x" cinsinden olduğu için bir orandır. "Veriler zaman birimi başına olduğunda HM kullanın" daha iyi bir sezgisel mi olur?

Kuzey Avrupa ülkeleri için Büyük Mac Endeksi'ni özetlemek isteseniz, GM’yi kullanır mısınız?


3
Birkaç yıl gecikti, ancak sorunuza bir cevap buldunuz: "Kuzey Avrupa ülkeleri için Büyük Mac Endeksi'ni özetlemek isteseniz, GM'i kullanır mısınız?" ?
İstatistikleri

2
@StatsScared Nope, ancak bu güzel bir soru olur!
Dimitriy V. Masterov

7

Sorunuza olası bir cevap ("hangi ortalamanın belirli bir bağlamda kullanmak için en uygun olduğuna nasıl karar veririm?") Olası bir cevap, İtalyan matematikçi Oscar Chisini tarafından verilen ortalamanın tanımıdır .

İşte daha ayrıntılı bir açıklama ve bazı örnekler içeren bir makale (ortalama seyahat hızı ve diğerleri).


6
Bağlantının kesilmesi durumunda, burada Chisini'nin tanımıyla ilgili birkaç satır ekleyebilirseniz, ve / veya okuyucuların fikirleri ilerletmek için bağlantıya tıklamak isteyip istemediklerini bilmelerine yardımcı olmak ideal olabilir.
gung

2
Gerçekten de, kağıdın bağlantısı kesildi. Wolfram bağlantısı, Chisini tanımının belirli bir bağlamda hangi araçların kullanılacağını belirlemek için ne kadar yararlı olduğu konusunda hiçbir fikir vermez; bana sadece kullanım reçetesinin aksine matematiksel bir genelleme gibi geliyor.
Ryan Simmons

1
DOI kullanılarak, kağıdın tandfonline.com adresine taşındığı görülmektedir. Alıntı: R Graziani, P Veronese (2009). Bir ortalama nasıl hesaplanır? Chisini yaklaşımı ve uygulamaları. Amerikan İstatistiği 63 (1), s. 33-36. tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf

0

Bence soruyu cevaplamanın basit bir yolu olacaktır:

  1. Eğer matematiksel yapı xy = k ise (değişkenler arasındaki ters ilişki) ve ortalama arıyorsanız, o zaman aritmetik ortalama - yani aritmetik ortalama -

Harmonik ortalama = 2ab / (a ​​+ b) = a (b / a + b) + b (a / (a ​​+ b)

Örneğin: Dolar maliyet ortalaması, bu kategoriye girer çünkü yatırım yaptığınız para miktarı (A) sabit kalır, ancak hisse başına fiyat (P) ve hisse sayısı (N) değişkendir (A = PN). Aslında, aritmetik bir ortalamanın iki sayı arasında eşit olarak ortalanmış bir sayı olduğunu düşünüyorsanız, harmonik ortalama da iki sayı arasında eşit olarak ortalanmış bir sayıdır, ancak (ve bu iyidir) "merkez", yüzdelerin (oranların) olduğu yerdir. eşit. Yani: (x - a) / a = (b -x) / b, ki burada x harmonik ortalamadır.

  1. Matematiksel yapı doğrudan bir y = kx varyasyonu ise, aritmetik ortalamayı kullanırsınız - bu harmonik ortalamanın bu durumda azaldığı şeydir.

1
$x$x\frac{a}{b}ab

Diyelim ki birkaç farklı modelin ortalamalarını bir araya getirmek istiyorum. Bu durumda hiç geometrik veya harmonik ortalama kullanmak mantıklı geliyor mu?
thecity2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.