Örnek ortalaması verildiğinde örnek medyanının beklenen değeri


16

Let Y medyan temsil ettiği ve izin boyutta rasgele numunenin ortalama belirtmektedir olan bir dağıtım . nasıl hesaplayabilirim ?X¯n=2k+1N(μ,σ2)E(Y|X¯=x¯)

Sezgisel olarak, normallik varsayımı nedeniyle, ve gerçekten de doğru cevap olduğunu iddia etmek mantıklıdır . Ancak bu titizlikle gösterilebilir mi?E(Y|X¯=x¯)=x¯

İlk düşüncem, bu soruna genellikle bilinen bir sonuç olan koşullu normal dağılımı kullanarak yaklaşmaktı. Sorun şu ki, beklenen değeri ve dolayısıyla medyanın varyansını bilmediğim için, dereceden istatistiği kullanarak bunları hesaplamak zorunda kalacağım . Ama bu çok karmaşık ve kesinlikle gerekmedikçe oraya gitmek istemem. k+1


2
Bunun stat.stackexchange.com/a/83887 adresinde yayınladığım genellemenin derhal bir sonucu olduğuna inanıyorum . Artıkların dağılımı xix¯ açıkça etrafında simetriktir, 0 böylece ortalama sıfır, medyan bir simetrik dağılımı vardır nereden. Bu nedenle, medyanın kendisi (sadece artıkların değil) beklentisi 0+E(X¯ | X¯=x¯)=x¯ , QED'e eşittir .
whuber

@whuber Pardon, artıklar?
JohnK

Onları benim yorumumda tanımladım: her bir xi ve ortalamaları arasındaki farklar .
whuber

@whuber Hayır anlıyorum ama hala diğer cevabınızın sorumla nasıl ilişkili olduğunu ve kullandığınız beklentinin tam olarak nasıl çalıştığını anlamaya çalışıyorum.
JohnK

2
@whuber Tamam, lütfen beni düzeltin Eğer yanılıyorsam, Ve şimdi ikinci terim sıfır çünkü medyan ˉ x etrafında simetriktir . Bu nedenle, beklenti ˉ x'eE(Y|X¯)=E(X¯|X¯)+E(YX¯|X¯)x¯x¯
düşüyor

Yanıtlar:


7

orijinal örneği ve Z'yi Z k = X k - ˉ X girişleriyle rastgele vektörü göstermesine izin verin . O zaman Z normal merkezlidir (ancak toplamları tam olasılıkla sıfır olduğu gerçeğinden de anlaşılacağı gibi girişleri bağımsız değildir). X'in lineer bir fonksiyonu olarak , vektör ( Z , ˉ X ) normaldir, bu nedenle kovaryans matrisinin hesaplanması, Z'nin ˉ X'den bağımsız olduğunu göstermeye yeterlidir.XZZk=XkX¯ZX(Z,X¯)ZX¯ .

dönülürse , Y = ˉ X + T görülür ; burada T , Z'nin medyanıdır . Özellikle, T sadece Z'ye bağlıdır, bu nedenle T , ˉ X'ten bağımsızdır ve Z'nin dağılımı simetriktir, bu nedenle T ortalanır.YY=X¯+TTZTZTX¯ZT

Son olarak,

E(YX¯)=X¯+E(TX¯)=X¯+E(T)=X¯.

Teşekkür ederim, bu neredeyse bir yıl önce soruldu ve birisinin sonunda temizlediğinden çok memnunum.
JohnK

7

Numune medyanı bir sipariş istatistiğidir ve normal olmayan bir dağılıma sahiptir, bu nedenle numune medyanının ve numune ortalamasının (normal dağılıma sahip olan) ortak sonlu-numune dağılımı iki değişkenli normal olmaz. Yaklaşımlara başvurmak, asimptotik olarak aşağıdaki bekletmeler (cevabımı buraya bakın ):

n[(X¯nYn)(μv)]LN[(00),Σ]

ile

Σ=(σ2E(|Xv|)[2f(v)]1E(|Xv|)[2f(v)]1[2f(v)]2)

burada örnek ortalaması ve μ popülasyon ortalaması, Y n örnek medyanı ve v popülasyon medyanıdır, f ( ) dahil rastgele değişkenlerin olasılık yoğunluğu ve σ 2X¯nμYnvf()σ2 varyansıdır.

Yaklaşık olarak büyük numuneler için, eklem dağılımları iki değişkenli normaldir, bu yüzden

E(YnX¯n=x¯)=v+ρσvσX¯(x¯μ)

nerede ρ korelasyon katsayısıdır.

Asimtotik dağılımın, numune ortalaması ve numune medyanının (ve standartlaştırılmış miktarların değil) yaklaşık büyük örnek eklem dağılımı olması için manipüle edildiğinde,

ρ=1nE(|Xv|)[2f(v)]11nσ[2f(v)]1=E(|Xv|)σ

Bu nedenle

E(YnX¯n=x¯)=v+E(|Xv|)σ[2f(v)]1σ(x¯μ)

Elimizde 2f(v)=2/σ2π biz gelmesi böylece, normal yoğunluk simetri

E(YnX¯n=x¯)=v+π2E(|Xμσ|)(x¯μ)

Burada . Şimdi standartlaştırılmış değişken standart bir normaldir, bu nedenle mutlak değeri, beklenen değere eşit olan yarı normal bir dağılımdır.v=μ2/π (altta yatan varyans birlik olduğu için). Yani

E(YnX¯n=x¯)=v+π22π(x¯μ)=v+x¯μ=x¯

2
Her zamanki gibi güzel cevap +1. Bununla birlikte, örneklem büyüklüğü hakkında hiçbir bilgimiz olmadığından, asimtotik dağılım olmayabilir. Tam dağılımı elde etmenin bir yolu yoksa, sanırım yapmak zorundayım. Çok teşekkür ederim.
JohnK

6

Cevap x¯ .

Let bir çok değişkenli dağılım F tüm majinal ortak bir değer etrafında simetrik olan olan u . (Bağımsız veya eşit olarak dağılmış olmaları önemli değildir.) ˉ x'i x i , ˉ x = ( x 1 + x 2 + + x n ) / n'nin aritmetik ortalaması olarak tanımlayın ve yazınx=(x1,x2,,xn)Fμx¯xi, x¯=(x1+x2++xn)/nxx¯=(x1x¯,x2x¯,,xnx¯) for the vector of residuals. The symmetry assumption on F implies the distribution of xx¯ is symmetric about 0; that is, when ERn is any event,

PrF(xx¯E)=PrF(xx¯E).

Applying the generalized result at /stats//a/83887 shows that the median of xx¯ has a symmetric distribution about 0. Assuming its expectation exists (which is certainly the case when the marginal distributions of the xi are Normal), that expectation has to be 0 (because the symmetry implies it equals its own negative).

x¯Y (the median of the xi) equals x¯ plus the median of xx¯. Consequently its expectation conditional on x¯ equals the expectation of xx¯ conditional on x¯, plus E(x¯ | x¯). The latter obviously is x¯ whereas the former is 0 because the unconditional expectation is 0. Their sum is x¯, QED.


Thank you for posting it as a full answer. I now understand the essence of your argument but I might ping you if something is still unclear.
JohnK

5
JohnK, I need to alert you to be cautious. A counterexample to this argument has been brought to my attention. I have encouraged its originator to post it here for further discussion, but briefly it concerns a discrete bivariate distribution with symmetric marginals but asymmetric conditional marginals. Its existence points to a flawed deduction early in my argument. I currently hope that the argument might be rescued by imposing stronger conditions on the xi, but my attention is presently focused elsewhere and I might not get to think about this for awhile.
whuber

4
In the meantime I would encourage you to unaccept this answer. I would ordinarily delete any answer of mine known to be incorrect, but (as you might be able to tell) I like solutions based on first principles rather than detailed calculations, so I hope this argument can be rescued. I therefore intend to leave it open for criticism and improvement (and therefore made it CW); let the votes fall as they may.
whuber

Of course, thanks for letting me know. We will discuss it further when you have time. In the meantime I will settle for the asymptotic argument proposed by @Alecos Papadopoulos.
JohnK

6

This is simpler than the above answers make it. The sample mean is a complete and sufficient statistic (when the variance is known, but our results do not depend on the variance, hence will be valid also in the situation when the variance is unknown). Then the Rao-Blackwell together with the Lehmann-Scheffe theorems (see wikipedia ...) will imply that the conditional expectation of the median, given the arithmetic mean, is the unique minimum variance unbiased estimator of the expectation μ. But we know that is the arithmetic mean, hence the result follows.

We did also use that the median is an unbiased estimator, which follows from symmetry.


1
By symmetry E[Y]=μ, indeed. Then from these two theorems we know that E[Y|X¯] is the Unique Minimum Variance Unbiased Estimator for μ which we already know to be equal to X¯. This is a brilliant answer, thank you very much. I would have marked it as the correct one, had I not done that already for another answer.
JohnK
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.