Öncül: bu aptalca bir soru olabilir. Sadece MLE asimptotik özellikleriyle ilgili açıklamaları biliyorum, ama kanıtları hiç çalışmadım. Eğer yapsaydım, belki bu soruları sormayacaktım, ya da belki de bu soruların anlamsız olduğunu fark ederdim ... bu yüzden lütfen bana kolay davran :)
Bir modelin parametrelerinin MLE tahmincisinin asimptotik olarak normal ve verimli olduğunu söyleyen ifadeler gördüm. İfade genellikle şu şekilde yazılır:
, N→∞ iken olarak
burada örnek sayısıdır, Fisher ve parametre (vektör) gerçek değeridir . Şimdi, gerçek bir modele referans olduğu için, bu model doğru değilse sonucun tutmayacağı anlamına mı geliyor?I θ 0
Örnek: Rüzgâr hızı artı toplayıcı Gauss gürültüsünün bir fonksiyonu olarak bir rüzgar türbini I model güç çıkışını varsayalım V
Modelin yanlış olduğunu biliyorum, en az iki nedenden dolayı: 1) , üçüncü gücü ile gerçekten orantılıdır ve 2) hata katkı maddesi değildir, çünkü rüzgar hızı ile ilişkisiz olmayan diğer tahmincileri ihmal ettim (ayrıca biliyorum) o 0 olmalıdır 0 rüzgar hızında) hiçbir güç oluşturulur, ama bu burada alakalı değil çünkü. Şimdi, rüzgar türbinimden gelen sonsuz bir güç ve rüzgar hızı verileri veritabanım olduğunu varsayalım. İstediğim kadar numune alabilirim. Her biri 100 boyutunda 1000 örnek çizdiğimi ve \ boldsymbol {\ beta}} _ {100} , \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2) hesaplamasını yaptığımı varsayalımV β 0(benim modelim altında sadece OLS tahmini olurdu). Böylece \ hat {\ boldsymbol {\ beta}} _ {100} dağıtımından 1000 örneğim var . Egzersizi N = 500,1000,1500, \ dots ile tekrarlayabilirim . As , dağılımı olmalıdır belirtilen ortalama ve varyans ile, asimptotik normal olmak eğilimindedir? Yoksa modelin yanlış olması bu sonucu geçersiz kılar mı?
Sormamın nedeni, nadiren (eğer varsa) modelin uygulamalarda "doğru" olmasıdır. Model doğru olmadığında MLE'nin asimptotik özellikleri kaybolursa, modelin doğru olduğu bir ortamda daha az güçlü olsa da, diğer durumlarda MLE'den daha iyi performans gösterebilecek farklı tahmin ilkelerini kullanmak mantıklı olabilir.
EDIT : yorumlarda gerçek model kavramının sorunlu olabileceği belirtildi. Aklımda şu tanım vardı: f_ parametre vektörü tarafından belirtilen bir model ailesi, her zaman yazabileceğiniz ailenin her modeli için
olarak tanımlayarak . Bununla birlikte, genel olarak hata dik olmayacak , ortalama 0'a sahip olmayacak ve modelin türetilmesinde varsayılan olarak dağıtılamayacaktır. Bir değer , bu iki özelliğe ve varsayılan dağıtıma sahipse, modelin doğru olduğunu söyleyebilirim. Bu doğrudan olduğunu söylemekle ilgili olduğunu düşünüyorum , çünkü ayrıştırmadaki hata terimi
yukarıda belirtilen iki özelliğe sahiptir.