Beklenen değer normal olmayan bir dağılımda ortalama, medyan vb. İle nasıl ilişkilidir?


9

Sürekli rasgele bir değişkenin beklenen değeri, normal olmayan bir dağılımda (örn. Çarpık-normal) aritmetik ortalaması, medyanı vb. İle nasıl ilişkilidir? Herhangi bir ortak / ilginç dağıtımlarla ilgileniyorum (örn. Log-normal, basit bi / multimodal dağılımlar, garip ve harika bir şey).

Çoğunlukla nitel cevapları arıyorum, ancak herhangi bir niceliksel veya formülik cevap da kabul edilebilir. Özellikle daha net hale getiren görsel temsiller görmek istiyorum.


Biraz daha net olabilir misin? Aritmetik ortalama ve medyan, belirli dağılımlara özgü herhangi bir şey değil, veriler için uyguladığımız işlevlerdir ... örneğin, örnek ortalamasını hesaplamanız için verilerin Normal olması gerekmez.
misafir

Tamam, bu yüzden soru teknik olarak "beklenen değer, belirli bir olasılık dağılımından rastgele çizilen verilerin ortalama, medyan vb . İle nasıl ilişkili ?" Olmalıdır. Basit, sezgisel anlayışlar arıyorum, sezgisel olarak bir dağılım daha çarpık olduğunda, medyan ve ortalama daha da ayrıktır ve medyan, verilerin nerede yattığının daha iyi bir göstergesini verebilir.
naught101

Heh. Teşekkürler Marco. Açıkça yanlış şeyler okuyorum. Bunu bir cevap olarak da yazabilirim, en iyi cevapta seçeceğim.
naught101

Yanıtlar:


8

(yukarıdaki silinmiş yorumumdan kısmen dönüştürüldü)

Beklenen değer ve aritmetik ortalama aynı şeydir. Medyan önemsiz olmayan bir şekilde ortalama ile ilişkilidir, ancak ilişkileri hakkında birkaç şey söyleyebilirsiniz:

  • dağılım simetrik olduğunda, ortalama ve medyan aynıdır

  • bir dağılım negatif çarpık olduğunda, medyan genellikle ortalamadan daha büyüktür

  • bir dağılım pozitif çarpık olduğunda, medyan genellikle ortalamadan daha azdır


İlginç. Ortalamanın medyandan daha büyük olduğu negatif eğimli bir dağılımın olağandışı davranışının hangi örnekleri vardır ?
naught101

@ naught101: bu bir yazım hatası mı? Negatif çarpık dağılım, merkez sol sonuçlarının merkez sağ sonuçlardan daha sık meydana geldiği ve bu nedenle düşük frekans sonuçlarının "kuyruğunun" sağa çıktığı bir dağılımdır. Böyle bir durumda, soldaki kambur daima (aritmetik) ortalama merkez solunu çeker, sağdaki kuyruk medyanı ortalamadan daha büyük tutacaktır.
Esad Ebrahim

@AssadEbrahim: Hayır, bu Macro'nun "medyan genellikle ortalamadan daha büyük " yorumuna atıfta bulunuyordu - Ben karşı örnekler istiyordum .
naught101

@ naught101: Bir unimodal dağılım durumunda karşı örnekler bir sonraki çizgisidir: kambur sağa doğru olduğunda, soldaki kuyruk medyanı ortalamanın altına çeker. Kuyruk ne kadar uzun olursa, medyan ve ortalama arasındaki boşluk da o kadar büyük olur.
Esad Ebrahim

1
Birinin bir medyanı ortalamada kullanması veya tam tersi olması gereken pratik koşullar nelerdir? Örneğin, yaşamların üstel bir dağılımı takip ettiği hayatta kalma analizinde, yaşamı / ölümü ikili olarak tahmin etmem gerekirse medyanı (yani şeylerin yarısı daha uzun sürer, yarısı daha az sürer) ya da ortalama ("beklenen" ömür) kullanmalıyım sonuç?
drevicko

5

Log-normalde dağılmış rastgele değişkenin harmonik, geometrik ve aritmetik ortalaması arasında güzel bir ilişki vardır.X~LN-(μ,σ2). İzin Vermek

  • 'HM(X)=eμ-12σ2 (harmonik ortalama),
  • G,M(X)=eμ (geometrik ortalama),
  • birM(X)=eμ+12σ2 (aritmetik ortalama).

Harmonik ve aritmetik ortalamanın çarpımının geometrik ortalamanın karesini verdiğini görmek zor değildir, yani

'HM(X)birM(X)=G,M2(X).

Tüm değerler pozitif olduğundan, squre kökünü alabilir ve geometrik ortalamalarınX harmonik ortalamasının geometrik ortalamasıdır. X ve aritmetik ortalaması X, yani

G,M(X)='HM(X)birM(X).

Ayrıca, iyi bilinen HM-GM-AM eşitsizliği

'HM(X)G,M(X)birM(X)

olarak ifade edilebilir

'HM(X)G,Vbirr(X)=G,M(X)=birM(X)G,Vbirr(X),

nerede G,Vbirr(X)=eσ2 geometrik varyanstır.


1

Tamlık için, ortalamanın iyi tanımlanmadığı dağılımlar da vardır. Klasik bir örnek Cauchy dağılımıdır ( bu cevabın nedeninin güzel bir açıklaması vardır). Bir diğer önemli örnek ise 2'den küçük üslü Pareto dağılımıdır .


1
Birkaç iff. Bir güç yasası bir dağıtım değildir, ancak Pareto dağılımı bir güç yasasıdır. Bu, bir log-dışbükey güç fonksiyonunun entegre edilememesi ile ilgilidir.x=0. Bir güç yasası için 2'den az, 2'den büyük değil
Carl

@Carl iyi puan - Cevabı buna göre düzenledim. Many thx (:
drevicko

0

Matematiksel olarak ortalama ve beklenti değerinin aynı şekilde tanımlanması doğru olsa da, çarpık bir dağılım için bu adlandırma kuralı yanıltıcı hale gelir.

Bir arkadaşına şehrindeki konut fiyatlarını sorduğunuzu düşünün çünkü orada gerçekten hoşuna gidiyor ve o şehre taşınmayı düşünüyorsunuz.

Konut ödüllerinin dağıtımı imimodal ve simetrik olsaydı, arkadaşınız size ortalama ev fiyatını söyleyebilir ve gerçekten piyasadaki bu evlerin çoğunu bu ortalama değer etrafında bulmayı bekleyebilirsiniz .

Ancak, konut fiyatlarının dağılımı imimodal ve çarpıksa, örneğin soldaki düşük fiyat aralığındaki çoğu ev ve sağdaki sadece bazı fahiş evler ile sağ eğimli ise, o zaman ortalama yüksek fiyatlara "çarpılacaktır" doğru.

Bu unimodal, çarpık ev fiyat dağılımı için piyasadaki medyanların çoğunda ev bulmayı bekleyebilirsiniz .


1
Çarpık unimodal dağılımlar için ne zaman demek istediğiniz açık değil, ev fiyat dağılımının medyan etrafında fiyatları var. Söylenebilecek olan, değerlerin yarısının medyanda ya da altında olacağı ve yarısı medyanda ya da üstünde olacaktır. Bu değerlerin ortalamaya ne kadar yakın olduğunu göstermez.
Michael R.Chernick

Son cümlenizin "medyan" ile bitmesi gerekiyor mu? Eğer öyleyse, medyanın yukarıda açıklanan popülasyondan alınan rastgele bir örneğin ortalamasına (ulaşılamayabilir, örneğin bir konut fiyatı değil) en yakın (ulaşılabilir) değer olması gerektiğini düşünüyorum. Yani ortalama olarak ortalama ortalama örneğe en yakın olan ortancadır. Değilse, bu değerlerin ortalamaya ne kadar yakın olduğu hakkında bir iddiada bulunmadım. Ortanca uzaklıkları hakkında bir iddiada bulundum.
Sol Hator
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.