Bir maksimum olabilirlik tahmininin standart hatası ne anlama gelir?


21

Ben bir matematikçi kendi kendine çalışma istatistikleri ve özellikle dil ile mücadele ediyorum.

Kullandığım kitapta şu sorun var:

Bir rastgele değişken olarak verilir -Dağıtık ile . (Tabii ki, bu soru için bir parametreye bağlı olarak herhangi bir dağılım alabilirsin.) Sonra , 21 , 6 , 32 , 2 beş değerinden oluşan bir örnek verilir.Pareto ( α , 60 ) α > 0 14XPareto(α,60)α>014216322

İlk kısım: "maksimum olabilirlik yöntemi kullanılarak, bir tahmin bulmak a ait a [örnek] baz". Bu bir sorun değildi. Cevaptır alfa4,6931 .α^αα^4.6931

Ama sonra: "standart hata için bir tahmin vermek a ."α^

Bununla ne kastedilmektedir? Yana α sadece sabit bir gerçek sayıdır, ben ne şekilde standart bir hata olabilir görmüyorum. I standart sapmasını belirlemek için Am Pareto ( α , 60 ) ?α^Pareto(α^,60)

Sorunun net olmadığını düşünüyorsanız, bu bilgiler de bana yardımcı olacaktır.


ne anlama geliyor? 60
Alecos Papadopoulos

Eğer için bir formül var mı a'dan ? Bu, standart hatasını tahmin etmenize yardımcı olacaktır. α^
soakley

1
@Glen_b Peki, alt sınır olsaydı, gerçekleşen örneğin tüm değerlerinin daha küçük olması nasıl olabilir?
Alecos Papadopoulos

1
@Alecos Bu mükemmel bir nokta. Benim yorumum bir anlam ifade etmiyor; Ben onu sildim.
Glen_b

1
@Alecos: f ( x ) = α λ α yoğunluğu ile dağılımdırPareto(α,λ) . f(x)=αλα(λ+x)α+1
Stefan

Yanıtlar:


17

Diğer cevap standart hatanın türetilmesini kapsıyor, sadece gösterimde size yardımcı olmak istiyorum:

Karışıklıklarınız, İstatistiklerde, Tahminciyi (bir işlevdir) ve belirli bir tahmini (tahmin edicinin belirli bir gerçekleştirilmiş örnek girdi olarak alırken aldığı değerdir) belirtmek için tam olarak aynı sembolü kullandığımızdan kaynaklanmaktadır.

Böylece α = h ( x ) ve α ( X = x ) = 4,6931 için X = { 14 ,α^=h(X)α^(X=x)=4.6931 . Böylece α ( X ) , bir rastgele değişken olarak, rastgele değişkenin ve böylece fonksiyonu kesinlikle bir değişimi sahip olmasıdır. x={14,21,6,32,2}α^(X)

ML kestiriminde, birçok durumda hesaplayabileceğimiz şey asimtotik standart hatadır, çünkü kestiricinin sonlu örnekleme dağılımı bilinmemektedir (türetilemez).

Kesin konuşmak gerçek bir sayı (ML tahmin hemen hemen her durumda gerçek sayı) yakınsar beri, bir asimptotik dağılımı yoktur. Ama miktar α^yakınsak (merkezi limit teoreminin uygulanması ile) normal bir rasgele değişkene.n(α^α)

Notational karışıklık ikinci nokta : En, değilse tüm metinler, yazacak ne ise ( "Avar" = asimptotik varyans ") demek olan Avar ( Avar(α^), bu miktar asimptotik varyans bakınız yaniAvar(n(α^α)), değil a ... Elimizdeki temel Pareto dağılımının durum içinn(α^α)α^

Avar[n(α^α)]=α2

ve bu

Avar(α^)=α2/n

(ama ne yazılır bulacaksınız olduğunu ) Avar(α^)=α2

Şimdi, ne de Tahmincisi anlamda α söylediği gibi, asimptotik bir sabite birleşir beri, bir "asimptotik varyans" vardır? Peki, yaklaşık anlamda ve büyük ama sonlu örnekler için. Yani "küçük" bir örnek arasında, burada Tahmin edicinin (genellikle) bilinmeyen dağılımı olan rastgele bir değişken olduğu ve tahmin edicinin sabit olduğu bir "sonsuz" örnek olduğu yerde, bu "büyük ama sonlu örnek bölgesi" olduğu Tahminci henüz sabit hale gelmemiştir ve dağılım ve varyansının bir döner kavşakta türetildiği durumlarda, önce Z = miktarının uygun asimptotik dağılımını elde etmek için Merkezi Limit Teoremini kullanarakα^ve işler torna ve yazma (normal clt bağlı olan) α = 1Z=n(α^α)(bir adım geri alınması ve işlenmesi sırasındaNsonlu gibi) gösterenanormal rasgele değişken bir afin fonksiyonu olarakZve normal olarak (yaklaşık her zaman) kendisini dağıtılmış.α^=1nZ+αnα^Z


+1 for distinguishing between α^ and n(α^α) -- certainly the notation can be inconsistent.
Nate Pope

21

α^ -- a maximum likelihood estimator -- is a function of a random sample, and so is also random (not fixed). An estimate of the standard error of α^ could be obtained from the Fisher information,

I(θ)=E[2L(θ|Y=y)θ2|θ]

θL(θ|Y=y)θyy provides about θ.

For a Pareto(α,y0) distribution with a single realization Y=y, the log-likelihood where y0 is known:

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
Plugging in to the definition of Fisher information,
I(α)=1α2
For a sample {y1,y2,...,yn} The maximum likelihood estimator α^ is asymptotically distributed as:
α^nN(α,1nI(α))=N(α,α2n), 
Where n is the sample size. Because α is unknown, we can plug in α^ to obtain an estimate the standard error:
SE(α^)α^2/n4.69312/52.1

1
For your second to last line, α^nN(α,1nI(α)), it doesn't appear the notation is correct. If n, then n can't appear on the right side. Instead, you want α^˙N(α,1nI(α))
user321627
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.