MLE tahmini, model doğru olmasa bile asimptotik olarak normal ve verimli mi?


13

Öncül: bu aptalca bir soru olabilir. Sadece MLE asimptotik özellikleriyle ilgili açıklamaları biliyorum, ama kanıtları hiç çalışmadım. Eğer yapsaydım, belki bu soruları sormayacaktım, ya da belki de bu soruların anlamsız olduğunu fark ederdim ... bu yüzden lütfen bana kolay davran :)

Bir modelin parametrelerinin MLE tahmincisinin asimptotik olarak normal ve verimli olduğunu söyleyen ifadeler gördüm. İfade genellikle şu şekilde yazılır:

, N∞ ikenθ^dN(θ0,I(θ0)1) olarakN

burada örnek sayısıdır, Fisher ve parametre (vektör) gerçek değeridir . Şimdi, gerçek bir modele referans olduğu için, bu model doğru değilse sonucun tutmayacağı anlamına mı geliyor?I θ 0NIθ0

Örnek: Rüzgâr hızı artı toplayıcı Gauss gürültüsünün bir fonksiyonu olarak bir rüzgar türbini I model güç çıkışını varsayalım VPV

P=β0+β1V+β2V2+ϵ

Modelin yanlış olduğunu biliyorum, en az iki nedenden dolayı: 1) , üçüncü gücü ile gerçekten orantılıdır ve 2) hata katkı maddesi değildir, çünkü rüzgar hızı ile ilişkisiz olmayan diğer tahmincileri ihmal ettim (ayrıca biliyorum) o 0 olmalıdır 0 rüzgar hızında) hiçbir güç oluşturulur, ama bu burada alakalı değil çünkü. Şimdi, rüzgar türbinimden gelen sonsuz bir güç ve rüzgar hızı verileri veritabanım olduğunu varsayalım. İstediğim kadar numune alabilirim. Her biri 100 boyutunda 1000 örnek çizdiğimi ve \ boldsymbol {\ beta}} _ {100} , \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2) hesaplamasını yaptığımı varsayalımV β 0PVβ0β^100β=(β0,β1,β2)(benim modelim altında sadece OLS tahmini olurdu). Böylece \ hat {\ boldsymbol {\ beta}} _ {100} dağıtımından 1000 örneğim varβ^100 . Egzersizi N = 500,1000,1500, \ dots ile tekrarlayabilirim N=500,1000,1500,. As N , dağılımı olmalıdır β^N belirtilen ortalama ve varyans ile, asimptotik normal olmak eğilimindedir? Yoksa modelin yanlış olması bu sonucu geçersiz kılar mı?

Sormamın nedeni, nadiren (eğer varsa) modelin uygulamalarda "doğru" olmasıdır. Model doğru olmadığında MLE'nin asimptotik özellikleri kaybolursa, modelin doğru olduğu bir ortamda daha az güçlü olsa da, diğer durumlarda MLE'den daha iyi performans gösterebilecek farklı tahmin ilkelerini kullanmak mantıklı olabilir.

EDIT : yorumlarda gerçek model kavramının sorunlu olabileceği belirtildi. Aklımda şu tanım vardı: f_ parametre vektörü tarafından belirtilen bir model ailesi, her zaman yazabileceğiniz ailenin her modeli için fθ(x)θ

Y=fθ(X)+ϵ

olarak tanımlayarak . Bununla birlikte, genel olarak hata dik olmayacak , ortalama 0'a sahip olmayacak ve modelin türetilmesinde varsayılan olarak dağıtılamayacaktır. Bir değer , bu iki özelliğe ve varsayılan dağıtıma sahipse, modelin doğru olduğunu söyleyebilirim. Bu doğrudan olduğunu söylemekle ilgili olduğunu düşünüyorum , çünkü ayrıştırmadaki hata terimiϵYfθ(X)Xθ0ϵfθ0(X)=E[Y|X]

Y=E[Y|X]+ϵ

yukarıda belirtilen iki özelliğe sahiptir.


3
MLE tahmini, model doğru olmasa bile genellikle asimptotik olarak normaldir, örneğin "en az yanlış" parametre değerleri için tutarlı olabilir. Ancak bu gibi durumlarda etkinlik veya diğer optimallik özelliklerini göstermek zor olacaktır.
kjetil b halvorsen

1
Verimlilikten önce tutarlılığa bakmalıyız. Gerçeğin arama alanınızda olmadığı bir senaryoda, farklı bir tutarlılık tanımına ihtiyacımız vardır ki: d (P *, P), burada d bir ıraksamadır P * d açısından en yakın modeldir ve P doğrudur. D KL divergensiyse (MLE'nin en aza indirdiği şey), örneğin model dışbükey olmadığı sürece Bayesci prosedürlerin tutarsız (en yakın modele ulaşamayacağı) bilinmektedir. Bu nedenle MLE'nin de tutarsız olacağını varsayıyorum. Dolayısıyla verimlilik kötü tanımlanır. homepage.tudelft.nl/19j49/benelearn/papers/Paper_Grunwald.pdf
Çağdaş Özgenc

1
@Cagdas Ozgenc: Birçok durumda (lojistik regresyon gibi) MLE hala "en az yanlış" parametrelerle tutarlıdır. Konveks olmayan davadaki tutarsızlık iddianız için bir referansınız var mı? Çok ilgilenir misiniz? (Lojistik regresyonun olasılık işlevi dışbükeydir)
kjetil b halvorsen

@kjetilbhalvorsen homepages.cwi.nl/~pdg/ftp/inconsistency.pdf Bu kafamın çok üzerinde, ama anladığım bu. Anlayışım yanlışsa lütfen beni düzeltin. Sonuçta ben sadece bir hobim.
Çağdaş Özgenç

4
"Model doğru" veya "en az yanlış" gibi terimler kullandığımızda başımız belada. Pratikte modellerle uğraşırken hepsi yaklaşıktır. Belirli varsayımlar yaparsak, istatistiksel özellikleri göstermek için matematiği kullanabiliriz. Burada olasılık matematiği ile pratik veri analizi arasında her zaman bir çatışma vardır.
Michael R.Chickick

Yanıtlar:


4

Bu sorunun tek bir cevabı olduğuna inanmıyorum.

Maksimum olabilirlik tahmini uygularken olası dağılım yanlışlığı göz önüne alındığında, "Yarı-Maksimum Olabilirlik" tahmincisi (QMLE) elde edilir. Bazı durumlarda QMLE hem tutarlı hem de asemptolojik olarak normaldir.

Kesin olarak kaybettiği şey asimtotik verimliliktir. Bunun nedeni, nın asimptotik varyansının (bu, yalnızca değil, asimptotik dağılımı olan miktardır ) her durumda, θn(θ^θ)θ^

(1)Avar[n(θ^θ)]=plim([H^]1[S^S^T][H^]1)

burada , log-olasılık olasılığının Hessian matrisidir ve , gradyantır ve şapka, örnek tahminleri gösterir.HS

Şimdi, eğer elimizde doğru şartname, biz, öncelikle, almak

(2)Avar[n(θ^θ)]=(E[H0])1E[S0S0T](E[H0])1

burada " " alt sınırı, gerçek parametrelerde değerlendirmeyi belirtir (ve orta terimin Fisher Information'ın tanımı olduğunu unutmayın) ve ikincisi, " bilgi matrisi eşitliği " nin tuttuğu ve belirttiği , yani asimptotik varyans sonunda0E[H0]=E[S0S0T]

(3)Avar[n(θ^θ)]=(E[H0])1

bu da Fisher bilgilerinin tersidir.

Ancak yanlış bir ifademiz varsa, ifadesi ifadesine yol açmaz (çünkü deki birinci ve ikinci türevler yanlış olasılığa dayanarak türetilmiştir). Bu da, bilgi matrisi eşitsizliğinin dayanmadığını, ifadesiyle sonuçlanmadığımızı ve (Q) MLE'nin tam asimtotik verim elde etmediğini ima eder .( 2 ) ( 1 ) ( 3 )(1)(2)(1)(3)


plim θ θ β = ( β 0 , β 1 , β 2 ) β 3 V θAvar rastgele değişkenin asimptotik varyansıdır ve olasılıkta yakınsama anlamına gelir, değil mi? Yanıtınız çok ilginç görünüyor, ama ben anlamadım sizin bağlamında olduğunu. Ben sağ değeri bir durumda atıfta bulundu basitçe yok: değeri ne olursa olsun nerede rüzgar türbini örneğini görmek , hiçbir yoktur terimi olmadığından ve ile ilişkili diğer öngörücüler eksik olduğu için modeli doğru yapan değer . Bu bağlamda ne anlama gelir? plimθθβ=(β0,β1,β2)β3Vθ
DeltaIV

üzgünüm, yorumumun ilk baskısı anlaşılmazdı: şimdi benim açımdan net olmalı. Başka bir deyişle, "true" yoksa, ifadesinde olarak ne yorumlamalıyız ? θ θθn(θ^θ)
DeltaIV

1
@DeltaIV Zero. QMLE bunu "yakalayacak" mı? Bu tutarlı olup olmayacağına bağlıdır - ve tekrar, bu sorunun tek bir cevabı yok
Alecos Papadopoulos

1
Anladım. Yani QMLE (tutarlıysa) değerine yaklaşmalıdır: @kjetilbhalvorsen tarafından önerildiği gibi bazı "en az yanlış" parametre değerine yaklaşacağını düşünürdüm. QMLE ve yazdığınız denklemler hakkında herhangi bir referans önerebilir misiniz? Teşekkürlerθ=0
DeltaIV

1
@DeltaIV Hayashi ch. 7 Ekstremum Tahmin Edicileri hakkında, MLE tutarlılığı, normallik vb. İle ilgili. QMLE ile ilgili olarak konu oldukça geniştir. Örneğin, "QMLE" altında, tahmin ettiğimiz parametrelerin herhangi bir "gerçek parametre" ile açık bir bağlantısı olmayabileceğini (ancak alıştırma hala bir tahmin olarak geçerli) kabul ettiğimiz durumlara sahip olabiliriz. ve böylece önerildiği gibi bir "en az yanlış" vektör elde edin.
Alecos Papadopoulos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.