Layman'ın Terimiyle Ortalama, Medyan, Modun Açıklanması


10

Bir sayı listesinin ortalama, medyan ve mod kavramını nasıl açıklarsınız ve sadece temel aritmetik becerileri olan biri için neden önemlidir? Çarpıklık, CLT, merkezi eğilim, istatistiksel özelliklerinden vb. Bahsetmeyelim.

Birine, bir sayı listesini "özetlemek" için hızlı ve kirli bir yol olduğunu açıkladım. Ama geriye dönüp baktığımda, bu pek aydınlatıcı değil.

Herhangi bir düşünce veya gerçek dünya örnekleri?


Bunlar "merkezi eğilim", yani farklı alanlarda "büyük olasılıkla sonuç" dur. Özellikle yoğunluk, düzen ve sıklık. Gerçek dünya da varyasyona sahiptir - bu nedenle standart sapma, çeyrekler arası (veya kuantil) aralık ve modlar arası aralık gibi şeyler de oldukça yararlıdır, çünkü bunlar "varyasyon eğilimi" veya "sonuçlardaki tipik varyasyonu" gösterir.
EngrStudent

Rasgele sayılar üreten bir makine olduğunu gösteren bir örnek verebilirsiniz. Ürettiği tüm sayıları bir liste içinde toplarsınız. Artık listedeki her numarayı göstermeden arkadaşlarınıza sunmak istiyorsunuz. Böylece, tarif etmenize yardımcı olabilecek önlemleri ararsınız. Ortalama / Medyan / Mod, makinenin temel özellikleri hakkında bilgi sağlayan üç benzer önlemdir.
Kevin Pei

@KevinPei Ama bu durumda "ne demek" ne anlama geliyor? Ortalama / Medyan / Mod, tartışmalı, müstakil bir örnekte çok fazla açıklama yapmaz.
Concerned_Citizen

1
Ortalama bulmak, çocuklar (aynı ağırlıktaki) rasgele sayı ve kiriş üzerinde keyfi pozisyonlara girdikten sonra tahterevalli dengeleyen pivot noktasını bulma problemidir. Ortanca bulmak aynı görevdir, sadece çocukların "bu" tarafta veya "o" tarafta sadece iki pozisyonda sıkı kümelenmeleri söylenir.
ttnphns

Dağıtım kavramı olmadan bunu açıklayamazsınız. Sadece temel aritmetik becerileri ile resim çizmek zorundasınız.
Aksakal

Yanıtlar:


6

Ortalama, medyan ve mod ile ilgili temel istatistiksel kavramlar hakkındaki bu basit ama derin soru için teşekkür ederiz. Bu kavramların sezgisel - aritmetik değil - anlayışını açıklamak ve kavramak için bazı harika yöntemler / gösteriler vardır, ancak maalesef bunlar yaygın olarak bilinmemektedir (veya okulda bilgim tarafından öğretilmemiştir).

Anlamına gelmek:

1. Denge Noktası: dayanak olarak ortalama

Kavramını anlamanın en iyi yolu, onu tekdüze bir çubuk üzerindeki denge noktası olarak düşünmek anlamına gelir . {1,1,1,3,3,6,7,10} gibi bir dizi veri noktası düşünün. Bu noktaların her biri tekdüze bir çubuğa işaretlenmişse ve her bir noktaya (aşağıda gösterildiği gibi) eşit ağırlıklar yerleştirilmişse, dayanak çubuğun dengelenmesi için verilerin ortalamasına yerleştirilmelidir.

resim açıklamasını buraya girin

Bu görsel gösterim de aritmetik bir yoruma yol açar. Bunun aritmetik gerekçesi, dayanağın dengelenmesi için, ortalamadan (dayanağın sol tarafında) toplam negatif sapmanın ortalamadan (sağ tarafta) toplam pozitif sapmaya eşit olması gerektiğidir. Dolayısıyla ortalama , bir dağılımda dengeleme noktası görevi görür .

Bu görsel, veri noktalarının dağılımı ile ilgili olduğu için ortalamanın hemen anlaşılmasını sağlar. Bu gösteriden kolayca anlaşılan ortalamanın diğer özelliği, ortalamanın her zaman dağılımdaki minimum ve maksimum değerler arasında olacağı gerçeğidir. Ayrıca, aykırı değerlerin etkisi kolayca anlaşılabilir - aykırı değerlerin varlığı dengeleme noktasını değiştirir ve dolayısıyla ortalamayı etkiler.

2. Yeniden dağıtım (adil pay) değeri

Ortalamayı anlamanın bir başka ilginç yolu, onu bir yeniden dağıtım değeri olarak düşünmektir . Bu yorum, ortalamanın hesaplanmasının ardındaki aritmetiğin biraz anlaşılmasını gerektirir, ancak ortalama kavramını sezgisel olarak kavramak için antropomorfik bir kalite - yani sosyalist yeniden dağıtım kavramı - kullanır.

Ortalamanın hesaplanması, bir dağılımdaki tüm değerlerin toplanmasını (değerler kümesi) ve toplamın dağıtımdaki veri noktalarının sayısına bölünmesini içerir.

x¯=(i=1nxi)/n

Bu hesaplamanın ardındaki mantığı anlamanın bir yolu, her veri noktasını elma (veya başka bir fungible ürün) olarak düşünmektir. Öncekiyle aynı örneği kullanarak, örneğimizde sekiz kişi var: {1,1,1,3,3,6,7,10}. İlk kişinin bir elması vardır, ikinci kişinin bir elması vardır, vb. Şimdi, elma sayısını herkes için “adil” olacak şekilde yeniden dağıtmak istiyorsa, bunu yapmak için dağıtımın ortalamasını kullanabilirsiniz. Başka bir deyişle, dağıtımın adil / eşit olması için herkese dört elma (yani ortalama değer) verebilirsiniz. Bu gösterim, yukarıdaki formül için sezgisel bir açıklama sağlar: bir dağılımın toplamını veri noktalarının sayısına bölmek, dağılımın tamamını tüm veri noktalarına eşit olarak bölmeye eşittir.

3. Görsel Anımsatıcılar

Aşağıdaki görsel anımsatıcılar, ortalamanın benzersiz bir şekilde yorumlanmasını sağlar:

resim açıklamasını buraya girin

Bu, ortalamanın tesviye değeri yorumlaması için bir anımsatıcıdır . A'nın üst çubuğunun yüksekliği, dört harfin yüksekliğinin ortalamasıdır.

resim açıklamasını buraya girin

Ve bu, ortalamanın denge noktası yorumu için başka bir anımsatıcıdır . Dayanağın konumu kabaca M, E ve çift N'nin konumlarının ortalamasıdır.

medyan

Bir çubuk üzerindeki dengeleme noktası olarak ortalamanın yorumlanması anlaşıldıktan sonra, medyan aynı fikrin bir uzantısıyla gösterilebilir: bir kolye üzerindeki dengeleme noktası .

Çubuğu bir dize ile değiştirin, ancak veri işaretlerini ve ağırlıklarını saklayın. Daha sonra uçlarda, bir kolye [kolye gibi] oluşturmak için birinciden daha uzun ikinci bir ip takın ve halkayı iyi yağlanmış bir kasnağın üzerine asın.

resim açıklamasını buraya girin

Başlangıçta, ağırlıkların farklı olduğunu varsayalım. Her iki tarafta aynı sayıda ağırlık olduğunda kasnak ve halka dengesi. Başka bir deyişle, medyan en düşük nokta olduğunda döngü 'dengeler'.

Ağırlıklardan biri, bir aykırı değer yaratan döngü yukarı doğru kaydırılırsa, döngü hareket etmediğini unutmayın. Bu, fiziksel olarak medyanın aykırı değerlerden etkilenmediğini gösterir.

kip

Mod muhtemelen en temel matematiksel işlemi içerdiğinden anlaşılması en kolay kavramdır: sayma. En sık görülen veri noktasına eşit olması bir kısaltmaya yol açar: “ M ost-sıklıkla O ccurring D ata E lement”.

Mod ayrıca bir kümedeki en tipik değer olarak düşünülebilir . (Bununla birlikte, 'tipik' hakkında daha derin bir anlayış temsili veya ortalama değere yol açacaktır. Bununla birlikte, 'tipik' kelimesinin 'tipik' kelimesinin tam anlamını temel alan mod ile eşitlenmesi uygundur.)


Kaynaklar:

  • Medyan bir denge noktasıdır - Lynch, College Mathematics Journal (2009)
  • İstatistikleri Unutulmaz Kılmak: Yeni Anımsatıcılar ve Motivasyonlar - Küçük, İstatistiksel Eğitim, JSM (2011)
  • Anımsatıcıların İstatistik Öğretiminde Kullanımı - Küçük, Model Destekli İstatistik ve Uygulamalar, 6 (2), 151-160 (2011)
  • Ortalama ne demek? - Watier, Lamontagne ve Chartier, İstatistik Eğitimi Dergisi, Cilt 19, Sayı 2 (2011)
  • Tipik? Çocukların ve Öğretmenlerin Ortalama Hakkındaki Fikirleri - Russell ve Mokros, ICOTS 3 (1990) GENEL REFERANS: http://www.amstat.org/publications/jse/v22n3/lesser.pdf

Bugün bu makaleye daha fazla ışık tutan bu makaleye rastladım: priceonomics.com/how-the-average-triumphed-over-the-median
Vishal

1
Anonim bir kullanıcı aşağıdaki genel referansı da önerdi: amstat.org/publications/jse/v22n3/lesser.pdf
gung - Monica'yı

3

Minimum malzeme ile maksimum etkinlik ve açıklayıcı güç istediğiniz gibi ölçütlerinizin ulaşılabilir olup olmadığını merak etmeliyim. Ama basit bir örnek gibi

1 1 2 2 2 3 3 4 5 6 15

(2), medyan (3) ve ortalama (44/11) = 4 modlarının derhal hesaplanmasını sağlar ve böylece bunların farklı olabileceğini gösterir.

Daha sonra en yaygın değer, ortadaki değer ve ortalama değerlerin fikirlerinin farklı olduğunu açıklayabilirsiniz . Ve komplikasyonları

  1. modu göstermek için değerleri değiştirmek belirsiz olabilir

  2. ortanca hesaplama kuralını açıklamak için eşit sayıda değere sahip bir örnek kullanma

  3. ortalamaya ne olduğunu ve bunun neden ve neden istenmeyeceğini vurgulamak için kuyruklarda değişen değerler.

  4. ortalama, medyan, modun iki veya üçünün çakıştığı daha basit örnekler kullanarak.

Çeşitli edebiyatlarda bir terim olduğunu söylemek dışında, öğretimimde merkezi eğilimden bahsetmedim. Seviye ve bunun nasıl nicelendirilebileceği hakkında konuşmayı tercih ederim . Tersine, insanlar simetriden daha normal bir çarpıklık hissine sahip olmadıkça ciddi bir veri analizinin mümkün olduğunu düşünmüyorum.


Evet, değerlerin ayarlanması özet istatistiklerini değiştirir, ancak yine de "ne demek" tek başına ne anlama gelir?
Concerned_Citizen

1
hesaplama anlama
shadowtalker

1
Ne olduğunu kırmızı ? Fikirleri kullanmak için her zaman tanımları bilmemize gerek yoktur. Kırmızının sağlam anlaşılması muhtemelen fizik, fizyoloji ve psikoloji gerektirir, ancak buna hiç ihtiyacım olmadı. Ortalamanın nasıl çalıştığı hakkında çok şey biliyorum, ancak temel düzeyde tanımı sadece formülüdür.
Nick Cox

1
@ NickCox çok adil ve çok doğru. ama kolejdeki deneyimim hala oldukça yeni ve ne hesapladığımı veya neden yaptığımı anlamadan körü körüne bir cevap hesapladığım çok fazla problem hatırlıyorum
shadowtalker

1
@ssdecontrol Bu tamamen gerçekleşmeyi hiç bitmiyor ...
Nick Cox

3

Onları şöyle açıklıyorum:

(Aritmetik) ortalama , tüm veri kümesini dikkate alan ve "ortada" bir yere yerleşen noktadır. Uzayda bir nokta bulutu veya bir damla düşünmelerini sağlayın: ortalama, o nokta bulutunun kütle merkezidir.

Medyan (bir "yan" kavramı 2+ boyutta iyi tanımlanmış değildir tabii ki) "her tarafta aynı puanı" sahip bir nokta. Bu başka bir tür "orta" ve aslında bir anlamda daha sezgisel bir türdür. Uzayda aynı blobun düşünüldüğünde, eğer damla ters çevrilirse ortalamanın değişeceği açıktır. Ancak bu kayma, iki yoldan biriyle elde edilebilir: ya bir alana daha fazla nokta eklersiniz ya da o bölgedeki noktaların dağılımını artırırsınız. Nokta sayısını arttırmadan bir alandaki noktaların dağılımını arttırırsanız, medyan hala "her tarafta" aynı sayıda noktaya sahiptir ve ortalama ile orantılı olarak değişmez.

y=(1,2,3,4,5)y=(1,2,3,4,99)mean(y)=median(y)mean(y)>median(y). Ama önce geometrik / görsel "damla tabanlı" açıklama ile başlamanızı öneriyorum: deneyimlerime göre, elle sallanan grafiksel bir gösteri ile başlamak, sonra da somut oyuncak örneklerine geçmek daha kolay. Çoğu insanın (kendim dahil) doğal olarak sayı odaklı olmadığını ve sayısal bir açıklama ile başlamak karışıklık için bir reçete olduğunu düşünüyorum. Daha sonra istediğiniz zaman geri dönüp daha kesin tanımları öğretebilirsiniz.

Modu noktaları rastgele bu damla numune halinde, (bu sürekli veri için bir yumuşak şekerleme olduğunu kabul) görünmesini büyük olasılıkla, bir nokta. Bu, ortalama veya medyanın yakınında olabilir, ancak olması gerekmez.

Bu kavramları açıkladıktan sonra , daha "istatistiksel görünümlü" bir demoya geçebilirsiniz:

gösteri

Düz çizgi ortalamadır. Kesikli çizgi medyan. Noktalı çizgi moddur. Ortalama, x ekseni boyunca veri noktalarının konumlarını temsil ederken, medyan her iki taraftaki yalnızca veri noktası sayısını yansıtır. Mod, hem ortalamadan hem de ortancadan farklı olan en büyük olasılık noktasıdır.

R kodu:

set.seed(47730)
y <- rgamma(100, 2, 2)
d <- density(y)
plot(d)
rug(y)
abline(v = mean(y), lty = 1)
abline(v = median(y), lty = 2)
abline(v = d$x[which.max(d$y)], lty = 3)

İyi açıklamalar, ama gerçekten bu "temel aritmetik beceriler" den çok daha fazla varsayıyor: geometrik düşünme, temel mekanik, rastgele örnekleme, olasılık teorisi (yoğunluk fonksiyonu dahil) burada çağrılmaktadır. Sorunun uzun bir düzen olduğunu düşündüğüm için, bu bir eleştiri eleştirisi olarak tasarlanmamış bir yorumdur.
Nick Cox

@NickCox kesinlikle iyi puan. Ama şimdi bunu düşündüğüm için, onları kullanarak duruyorum, çünkü hepsi matematik olmadan açıklanabilir (örneğin, ana sorudaki yorumlarda ttnphns'ın "see-saw" açıklaması) veya zaten bir çok insan tarafından sezgisel olarak bir düzeyde anlaşıldı. Yoğunluk biraz ulaşılabilir, ama oraya hiç gitmen gerektiğini sanmıyorum
shadowtalker

(@ttnphns: tartmak istediğiniz takdirde sizi etiketliyor. ikinizi de tek bir yorumda etiketlememe izin vermiyor)
shadowtalker

Yoğunluk o kadar abartılı değil. Çoğu insan fizikten yoğunluğu ve coğrafyadan nüfus yoğunluğunu ya da sadece genel bilgiyi hatırlamalıdır.
Nick Cox

@NickCox Temel mekanikten bahsederek bunun ne demek istediğini sanıyordum. Yoğunluk demosu dışında burada da rastgele örneklemenin nasıl gerekli olduğunu görmüyorum. Bir şey olursa, yapışma noktasının teknik olmayan bir öğrenciyi bir nokta bulutu fikriyle rahatlatacağını hayal ettim. Belki bunu sohbet etmek için mi alabilirsin?
shadowtalker

2

" Ortalama ", " medyan " ve " mod ", farklı alanlarda "merkezi eğilim", yani "büyük olasılıkla sonuç" dur. Hepsi farklı "oyunlarda" en iyi bahislerdir.

Olasılık ve İstatistik, kısmen kumarbazlar ( link , link ) tarafından inşa edilmiş bir alandır . At yarışlarına veya poker masasına gittiğinizde, kazanmanıza yardımcı olacak bazı bilimleri bilmek istersiniz. Onlar da yaptılar ve yazdılar, bu yüzden kendiniz icat etmek zorunda değilsiniz.

Bir at yarışında bir kazanan seçmek istersiniz. Gelecekteki bilgileriniz yok, ancak geçmişteki bazı bilgileri biliyorsunuz. Son birkaç yarışta her atın ne kadar hızlı koştuğunu biliyorsunuz. Bir sonraki yarışlarında ne kadar hızlı koşacaklarını tahmin etmek istiyorsanız, ortalamayı, yani ortalama, yarış sürelerini hesaplayabilir ve karşılaştırabilirsiniz.

Diğer bir merkezi eğilim, sıralı listenin merkezi olan "medyan" dır. Yarış zamanları listesine korkunç bir yazım hatası koyarsam ve değer diğerlerinden 1000 kat daha uzun olsaydı. Tahmininizi bozar. Kazanan atın üzerine bahse giremeyebilirsiniz. Bunu nasıl ele alıyorsunuz? Bu değeri manuel olarak arayabilir veya "medyan" değerini kullanabilirsiniz.

Ya " blackjack " gibi kartlar oynuyorsanız ve önceki kartlara verilen başka bir karta ihtiyacınız olup olmadığını anlamaya çalışıyorsanız. Aradığınız kartlar 3.14 değil çünkü kart numaraları tamsayıdır. "Ortalama" veya medyan anlamlı olmadığında en iyi bahsinizin ne olduğunu nasıl anlarsınız? Bu durumda, "mod" üzerine bahis oynamak istersiniz - bayi yığınından çıkması en muhtemel kart.

Her üç durumda da, merkezi eğilim "en iyi bahis" demenin başka bir yoludur.

Eğer sadece bahislerinizdeki merkezi eğilimi hesaba katmak istemiyorsanız, yani bahisleri maksimuma çıkarırken bir zararın etkilerini azaltabilmeniz için bahse girmek istiyorsanız, "varyasyon eğilimlerine" bakmalısınız. Standart sapma, kuantiller arası aralıklar veya alternatif modlar ve bunların frekansları gibi şeyler, olası kazançları en üst düzeye çıkarırken maksimum kayıpları en aza indirmek için kullanılır.


0

Birden fazla yöntem, medyan ve mod düşünürken bu kavramı açıklamanın yararlı olduğunu düşünüyorum. Bu değerler boşlukta tek başlarına yoktur.

Mesela, anlamı nasıl açıklayacağım.

Diyelim ki 2 kasanız var (sandık 1 ve 2). Kapalıdır, böylece içindeki karpuzları göremezsiniz ve böylece boyutlarını bilmezsiniz. Ancak, her sandıktaki karpuzların toplam ağırlıklarını biliyorsunuz ve her biri aynı sayıda karpuz içeriyor. Bundan, her karpuz sandığının (M1 ve M2) ortalama ağırlıklarını hesaplayabilirsiniz.

Artık iki farklı ortalama değer M1 ve M2'ye sahip olduğunuza göre, tek tek içeriklerin kabaca bir karşılaştırmasını yapabilirsiniz. M1> M2 ise, sandık 1'den rastgele seçilen bir karpuz muhtemelen sandık 2'den alınandan daha ağır olabilir.

Tabii ki, bu bakış açısıyla ilgili yorumları çok isterim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.