Momentler yönteminin küçük örneklemlerde en yüksek olasılığı yakalayabildiği örnekler?


57

Maksimum olabilirlik tahmin ediciler (MLE) asimptotik olarak verimlidir; Pratik sonuçları, küçük örneklem boyutlarında bile, çoğu zaman (MoM) tahmin yönteminden (farklı olduklarında) daha iyi yaptıklarını görüyoruz.

Burada 'daha iyi', her ikisi de tarafsız olduğunda tipik olarak daha küçük varyansa sahip olma anlamında ve tipik olarak daha genel olarak daha küçük ortalama kare hatası (MSE) anlamına gelir.

Ancak, soru ortaya çıkar:

MoM'nin MLE'yi - MSE'deki , örneğin küçük örneklerde - yenebileceği durumlar var mı?

(bu durum tuhaf / dejenere bir durum değil - yani ML'nin var olması / asimptotik olarak verimli olması koşullarıyla)

Bir takip sorusu daha sonra 'ne kadar büyük olabilir?' - eğer örnekler varsa, hala nispeten büyük örneklem boyutlarında, belki de tüm sonlu örneklem boyutlarında olan bazı var mı?

[Sonlu örneklerde ML'yi yenebilen önyargılı bir tahminci örneği bulabilirim, ancak bu MoM değil.]


Not geriye dönük olarak eklendi: Buradaki odağım temel olarak tek değişkenli dava üzerine odaklandı (asıl merakımın nereden geldiği). Çok değişkenli vakaları dışlamak istemem ama aynı zamanda James-Stein tahmininin genişletilmiş tartışmalarına da yer vermek istemiyorum.


Sorun değil; hepimize ve bana senden daha sık oluyor. Muhtemelen onu başlığa koymalıydım, ama zaten çok uzundu.
Glen_b

@cardinal Şimdi kriterleri daha net hale getirdim.
Glen_b

3
Momentler yönteminin maksimum olasılığı "yenebileceği" başka yollar da vardır. Örneğin, Normal karışım kestirim problemlerinde, MLE, MoM değilken hesaplanması oldukça zor.
vqv

@vqv Kesinlikle bu, MoM'nin tercih edilebileceği bir anlamdır.
Glen_b

2
Ben plebeians yakınlık eğilimi beri, IID Forma numunesinde bilgilendirmek için aylık tahmin numune boyutu ise patrician (MLE) ile aynı MSE sahip veya ... Ama ne yazık ki, daha büyük örneklem büyüklüğü için, patrici egemenliğini tekrar ortaya koyuyor ...θ 1 2U(0,θ)θ12
Alecos Papadopoulos

Yanıtlar:


36

Bu düşünülebilir ... aldatma, ancak OLS tahmincisi bir MoM tahmincisidir. Standart bir doğrusal regresyon spesifikasyonu düşünün ( stokastik regresörlerle, bu yüzden büyüklükler regresör matrisine şartlıdır) ve . ifadesini , hata teriminin varyansının OLS tahmincisi olarak belirtin . Bu kadar tarafsızn s 2 σ 2Kns2σ2

MSE(s2)=Var(s2)=2σ4nK

Şimdi nin MLE'sini düşünün . Buσ2

σ^ML2=nKns2
Önyargılı mı? Onun MSE

MSE(σ^ML2)=Var(σ^ML2)+[E(σ^ML2)σ2]2
MLE'yi OLS cinsinden ifade etme ve elde ettiğimiz OLS tahmincisi varyansı için ifadeyi kullanma

MSD( σ 2 M L )=2(n-K)+K2

MSE(σ^ML2)=(nKn)22σ4nK+(Kn)2σ4
MSE(σ^ML2)=2(nK)+K2n2σ4

Koşullarını (eğer varsa) hangi şartlarda istiyoruz?

MSE(σ^ML2)>MSE(s2)2(nK)+K2n2>2nK

2(nK)2+K2(nK)>2n2
2n24nK+2K2+nK2K3>2n2
Basitleştiriliyor - Bu ikinci dereceden için negatif değerler elde etmek uygun mudur ? Olumlu olması için ayrımcısına ihtiyacımız var. Biz de, bir ikinci dereceden bir bu kez. Bu ayrımcı yani , bir tamsayı olduğunu hesaba katar . Eğer
4n+2K+nKK2>0K2(n+2)K+4n<0
K
ΔK=(n+2)216n=n2+4n+416n=n212n+4
n
Δn=12242=816
n1,n2=12±8162=6±42n1,n2={1,12}
nnBiz o var bu aralıkta içindedir ve ikinci dereceden her zaman pozitif değerler alır, bu yüzden gerekli eşitsizliği elde edilemez. Yani: 12'den büyük örneklem büyüklüğüne ihtiyacımız var.ΔK<0K

Bu göz önüne alındığında kuadratik için kökleriK

K1,K2=(n+2)±n212n+42=n2+1±(n2)2+13n

Genel: örneklem büyüklüğü ve sayısı için , için Örneğin, ise, kişi regresör sayısının eşitsizliğin tutması için olması gerektiğini tespit eder. Az sayıda regresör için MLE'nin MSE anlamında daha iyi olması ilginçtir.n>12KK1<K<K2

MSE(σ^ML2)>MSE(s2)
n=505<K<47

EK
köklerine yönelik denklemi yazılabilir -quadraticK

K1,K2=(n2+1)±(n2+1)24n
Ben hızlı bir görünüm ile düşünmek olduğunu alt kök hep seveceğim ima olmak önsavının kadar olduğunda MLE -SO (hesabı "tam sayı değeri" kısıtlama içine alarak) MSE-etkili olacaktır herhangi bir (sonlu) bir numune boyutu için.55

1
Şartname ile birlikte verilen teorik moment koşulu, . örnek analogunu için bir tahminci olarak kullandığımız dereceye kadar olduğunu söyleyebilirim. E(uuX)=σ2E(uuX)σ2
Alecos Papadopoulos

1
@AlecosPapadopoulos Tartışacağım "örnek analogu", payda için alacaktır , yani MLE ile aynı olacaktır. Teorik beklentiyi ampirik beklenti ile değiştiriyorsanız , payda ile nasıl sonuçlanır ? Doğal zaman şartları olmalıdır ve ampirik beklentileri ile değiştirilmesi alacağı payda. nnKE[Xk(YXβ)]=0E[(YXβ)2]=σ2n
adam

2
@guy Bu geçerli bir yorum. Özgürlük derecesi düzeltmesi, her zaman benim için, Momentler Yöntemi ile kavramsal bir konudur. Tüm "örnek analog" sıkı bir kavram değildir ve bu bolunmesı değerle -but bir asimptotik çerçevesinde ikinci asimptotik mektuplaşmayla "numune aracı" kavramı ile bağlantılı sonra yerine yapar fark yaratma. Benim için çözülmemiş bir konu olarak kalıyor. Öte yandan, maksimum olabilirlik tahmincisi, olasılık denklemleriyle somut bir şekilde belirlenir ve MoM ile uyumlu olabilir veya olmayabilir (CONTD)nKn
Alecos Papadopoulos

1
@guy (CONTD). Yani diyorsun ki bu durumda hata varyans MoM tahmincisi olduğunu ise maksimum olabilirlik tahmincisi ve bu yüzden türetilmiş sonuç ML ile aya değil karşılaştırır, fakat EKK ile ML (ikincisi kendi başına bir kategori olmak üzere). .. evet, bunun (ayrıca) durum olduğu da söylenebilir.
Alecos Papadopoulos

1
"MoM Tahmincisi" diye bir şey var mı? Bu "bir" MoM tahmincisi, değil mi? Rastgele seçilen bir OLS rezidüel alırsanız, , o zaman . Bu mükemmel bir an durumu, değil mi? Ve için mükemmel bir MoM verir , hayır? Yani, her zamanki OLS tahmincisi, . eE(e2)=nknσ2σ2s2
Bill

17

"Bu makalede, iki parametreli Ters Gauss dağılımının yeni bir parametresini ele alıyoruz. Ters Gauss dağılımının parametrelerinin tahmin edicilerini momentler yöntemi ve maksimum olabilirlik yöntemi ile bulduk. Sonra, verimliliğini karşılaştırdık." Önyargıları ve ortalama kare hatalarını (MSE) temel alan iki yöntemin tahmin edicileri, bunun için parametrelerin değerlerini belirliyoruz, simülasyonları çalıştırıyoruz ve her iki metot tarafından elde edilen tahminler için MSE ve önyargıyı rapor ediyoruz, sonuç, örneklem büyüklüğü 10 olduğunda, Moment yöntemi Her iki parametre (lambda ve teta) tahminlerine için maksimum olabilirlik yöntemiyle daha etkili olma eğilimindedir ...." devamı

Günümüzde kişi yayınlanan her şeye güvenememektedir (ya da etmemelidir), ancak makalenin son sayfası ümit verici görünmektedir. Umarım bu, notunuzun geriye dönük olarak eklenmesine yöneliktir.


1
Bu makaledeki tabloları doğru anladıysam doğru olduğuna inanıyorum - bazı örneklem boyutlarında, moment metodu (makalede MME), en azından değerinde MLE'yi dışlamış gibi görünüyor . (Bununla birlikte, simülasyon sonuçlarının bazıları, biraz tuhaf görünmemektedir - örneğin, p49'daki en sağdaki sütunun ilerlemesi.) - Bu, benim için çok ilginç bir sonuçtur çünkü Ters Gaussian nispeten yaygın olarak kullanılmaktadır. θ
Glen_b

İyi bulmak! Sonuçlar kapalı olsa bile, açıkça bir yerde belirtilen iddiayı görmek güzel.
Ben Ogorek

Cevabımla bağlantılı olduğum makale burada bütünüyle mevcut olan bir yüksek lisans tezinden kaynaklanmıştır: digi.library.tu.ac.th/thesis/st/0415 İlgili beyan için bkz. Bölüm 5.2. Profesör de dahil olmak üzere altı kişi bu sonuçtan vazgeçti.
Hazırda Bekletme

14

Hosking ve Wallis (1987) tarafından "Genelleştirilmiş Pareto Dağılımı için Parametre ve Miktar Tahmini" nde yapılan simülasyonlara göre, cdf tarafından verilen iki parametreli genelleştirilmiş Pareto dağılımının parametreleri

G(y)={1(1+ξyβ)1ξξ01exp(yβ)ξ=0

veya yoğunluk

g(y)={1β(1+ξyβ)11ξξ01βexp(yβ)ξ=0

ML yerine MOM ile tahmin edilirlerse daha güvenilirdirler. Bu, 500 boyutuna kadar olan numuneler için geçerlidir. MOM tahminleri

β^=y¯y2¯2(y2¯(y¯)2)

ve

ξ^=12(y¯)22(y2¯(y¯)2)

ile

y2¯=1ni=1nyi2

Bu yazıda epeyce yazım hataları var (en azından versiyonum yazıyor). Yukarıda verilen MOM tahmin edicileri için sonuçlar bu konudaki "heropup" tarafından sağlanmıştır .


Bunun için teşekkürler. Şimdiye kadar aradığım şeyin en basit örneklerinden biri.
Glen_b

13

Bir tane buldum:

Asimetrik üssel güç dağılımı için

f(x)=ασΓ(1α)κ1+κ2exp(κασα[(xθ)+]α1κασα[(xθ)]α),α,σ,κ>0, and x,θR

Delicado ve Goria'nın (2008) simülasyon sonuçları, daha küçük örneklem büyüklüğündeki bazı parametreler için moment yönteminin MLE'den daha iyi performans gösterdiğini; örneğin, 10 nolu örneklemdeki bilinen durumda, değerini tahmin ederken , MoM'nin MSE'si ML'den daha küçüktür.θσ

Delicado ve Goria (2008),
Asimetrik üstel güç dağılımı için azami olasılık, moment ve L moment yöntemlerinin küçük bir örneklem karşılaştırması,
Dergi Hesaplamalı İstatistik ve Veri Analizi
Cilt 52 Sayı 3, Ocak, s. 1661-1673

(ayrıca bkz. http://www-eio.upc.es/~delicado/my-public-files/LmomAEP.pdf )


13

Momentler yöntemi (MM), yalnızca bazı popülasyon anlarını belirlemek mümkün olduğunda maksimum olasılık (ML) yaklaşımını yenebilir. Dağıtım hatalı tanımlanmışsa, ML tahmin edicileri tutarlı olmayacaktır.

Sonlu momentler ve iid gözlemleri varsayarak, MM güzel asimptotik özelliklere sahip iyi tahmin ediciler sağlayabilir.

Örnek: ddots, X_n'in bir iid örneği olmasına izin verin ; bilinmeyen bir olasılık yoğunluğu işlevidir. Tanımla inci moment ve ilgi ileri momenti tahmin etmek olduğunu dikkate . X f f : RR + ν k = R x k f ( x ) d x k ν 4X1,,XnXff:RR+νk=Rxkf(x)dxkν4

Let ardından varsayılarak bu , merkezi sınır teoremi garanti burada " " "dağıtımda" ile yakınsama anlamına gelir . Dahası, Slutsky teoremi tarafındanXk¯=1ni=1nXikν8<

n(X4¯ν4)dN(0,ν8ν42),
d

¯X8-¯X42Pν8-ν24

n(X4¯ν4)X8¯X4¯2dN(0,1)
yana olasılık (yakınsama).X8¯X4¯2Pν8ν42

Yani, moment yaklaşımı kullanarak (büyük örnekler için) için (yaklaşık) çıkarımlar yapabiliriz , sadece ilgilenilen popülasyon anları üzerinde bazı varsayımlarda bulunmak zorundayız. Burada, maksimum olasılık tahmin edicilerinin şeklini bilmeden tanımlanamazlar . fν4f

Bir Simülasyon çalışması:

Patriota ve diğ. (2009) değişken-hata modelinde hipotez testlerinin reddetme oranlarını doğrulamak için bazı simülasyon çalışmaları yapmıştır. Sonuçlar, MM yaklaşımının boş hipotez altında nominal örneklere küçük örneklerde ML'den daha yakın olan hata oranları ürettiğini göstermektedir.

Tarihsel not:

Momentlerin yöntemi K. Pearson tarafından 1894'te "Matematiksel Evrim Teorisine Katkılar" tarafından önerilmiştir. Maksimum olasılık yöntemi, 1922'de "Teorik İstatistiğin Matematiksel Temelleri" adlı RA Fisher tarafından önerildi. Londra Kraliyet Cemiyeti'nin Felsefi İşlemlerinde yayınlanan iki bildiri, A Serisi.

Referans:

Fisher, RA (1922). Teorik İstatistiklerin Matematiksel Temelleri Üzerine, Londra Kraliyet Cemiyetinin Felsefi İşlemleri, Seri A, 222, 309-368.

Patriota, AG, Bolfarine, H, Castro, M (2009). Denklem hatası ile değişken bir heterossedastik yapısal hatalar modeli, İstatistiksel Metodoloji 6 (4), 408-423 ( pdf )

Pearson, K (1894). Matematiksel Evrim Teorisine Katkılar, Londra Kraliyet Cemiyetinin Felsefi İşlemleri, Seri A, 185, 71-110.


1
Cevabınız potansiyel olarak ilginç bir cevap gibi geliyor. Biraz genişleyebilir misin? Tam olarak gördüğümden emin değilim.
Glen_b

@Glen_b lütfen, son eklememin size yardımcı olup olmadığını kontrol edin.
Alexandre Patriota

Bunun için teşekkürler; Neye bulaştığını gördüğüme inanıyorum.
Glen_b

Tamam, bu genel bir yorum ama sorunuzu yanıtladığını düşünüyorum. Veri davranışı hakkında toplam bilgi verirseniz, ML yaklaşımının MM yaklaşımından daha iyi performans göstermesi oldukça doğaldır. Makalede [1], değişken-hata modelinde hipotez testlerinin reddedilme oranlarını doğrulamak için bazı simülasyon çalışmaları yürütmekteyiz. Sonuçlar, MM yaklaşımının boş hipotez altında, küçük numuneler için ML olandan nominal seviyeye daha yakın hata oranları ürettiğini göstermektedir. [1] ime.usp.br/~patriota/STAMET-D-08-00113-revised-v2.pdf
Alexandre Patriota

Bu, atipik bir moment yöntemi örneğidir (MoM). MoM, genellikle iyi tanımlanmış bir parametrik dağılım ailesi olan parametrik tahmin problemlerinde kullanılmaktadır. Öte yandan, parametrik olmayan bir maksimum olabilirlik tahminini burada tanımlayabilirsiniz . F-hat, ampirik dağılım fonksiyonu, F bilinmeyen dağılım fonksiyonunun parametrik olmayan maksimum olasılık tahminidir. 4. anın F'nin bir işlevselliği olduğu düşünüldüğünde, 4. anın parametrik olmayan MLE'sinin F-hattının 4. anı olduğu . Bu örnek 4'üncü an ile aynıdır.
vqv

5

MOM lehine ek kaynaklar:

Hong, HP ve W. Ye. 2014. Kar derinliği kayıtlarını kullanarak Kanada için aşırı yer kar yüklerinin analizi . Doğal Tehlikeler 73 (2): 355-371.

MML kullanımı, örneklem büyüklüğü küçükse gerçekçi olmayan tahminler verebilir (Hosking ve ark. 1985; Martin ve Stedinger 2000).


Martins, ES ve JR Stedinger. 2000. Genelleştirilmiş maksimum olabilirlik hidrolojik veriler için genelleştirilmiş aşırı değerli nicelik tahmin ediciler . Su Kaynakları Araştırması 36 (3): 737-744.

Soyut, Özet:

Üç parametreli genelleştirilmiş aşırı değer (GEV) dağılımı, yıllık sel, yağış, rüzgar hızları, dalga yükseklikleri, kar derinliği ve diğer maksimumları tanımlamak için geniş bir uygulama alanı buldu. Önceki çalışmalar, küçük örneklemde maksimum olabilirlik tahmin edicilerinin (MLE) parametrelerin dengesiz olduğunu ve L momenti tahmin edicilerini önerdiğini göstermektedir. Daha yeni araştırmalar, momentantik tahmin edicilerin moment yönteminin L momentlerinden ve MLE'lerden −0.25 <κ <0,30 daha küçük kök-kare-kare hatası olduğunu göstermektedir. Küçük örneklerde MLE'lerin davranışının incelenmesi, GEV-şekli parametresinin κ saçma değerlerinin üretilebileceğini göstermektedir. Genelleştirilmiş bir maksimum olabilirlik (GML) analizinde κ değerlerini istatistiksel / fiziksel olarak makul bir aralıkla sınırlamak için bir Bayesian dağıtımının kullanılması bu sorunu ortadan kaldırır.

Giriş ve Edebiyat İnceleme bölümlerinde, bazı durumlarda MOM'in MLE'den daha iyi performans gösterdiği sonucuna varmıştır (örneğin, aşırı değer modellemesi);

Hosking ve diğ. [1985a], küçük örneklemeli MLE parametre tahmin edicilerinin çok dengesiz olduğunu ve L momenti tahmin edicilerine eşdeğer olan olasılık ağırlıklı moment (PWM) tahmin edicilerinin önerildiğini göstermektedir [Hosking, 1990]. [...]

Hosking ve diğ. [1985a], GEV dağılımı için olasılık ağırlıklı momentler (PM) veya eşdeğer L momentler (LM) tahmin edicilerin, 15 ila 100 arasında değişen numune büyüklükleri için önyargı ve varyans açısından, maksimum olabilirlik tahmincilerinden (MLE) daha iyi olduğunu göstermiştir. Daha yakın zamanda, Madsen ve ark. [1997a], momentlerin (MOM) kuantil tahmin edicilerinin, 10-50'lik numune büyüklükleri için 100 yıllık olayı tahmin ederken, LM ve MLE'den -0.25 <K <0.30 için daha küçük RMSE'ye (kök-ortalama-kare-ror) sahip olduğunu gösterdi. . MLE'ler yalnızca K> 0.3 ve örnek boyutları mütevazı olduğunda tercih edilir (n> = 50).

K (kappa), GEV'nin şekil parametresidir.

tırnak içinde görünen yazılar:

Hosking J, Wallis J, Ağaç E (1985) Genelleştirilmiş aşırı değer dağılımının olasılık ağırlıklı momentler yöntemi ile tahmini . Technometrics 27: 251-261.

Madsen, H., PF Rasmussen ve D. Rosbjerg (1997) Aşırı hidrolojik olayların modellenmesinde yıllık maksimum seri ve kısmi süreli seri yöntemlerinin karşılaştırılması , 1, Yerinde modelleme, Su kaynağı. Res., 33 (4), 747-758.

Hosking, JRM, L-momentleri: Sıra istatistiklerinin doğrusal kombinasyonlarını kullanarak dağılımların analizi ve tahmini , JR Stat. Soc, Ser. B, 52, 105-124, 1990.


Ek olarak, küçük ve orta büyüklükteki (<50-100 tipik olan) aşırı olayların modellenmesi durumunda (tipik olan <50-100) MLE gerçekçi olmayan sonuçlar verebilir, simülasyon, MOM'un daha sağlam ve daha küçük RMSE.


3

Buna cevap verme sürecinde: Binom için tahmin parametreleri Bu yazıya tökezledim:

Ingram Olkin, John Petkau, James V Zidek: Binom Dağılımı için N tahmin edicilerin karşılaştırması. Jasa 1981.

Bu, anların yönteminin, en azından bazı durumlarda, maksimum olasılığını yendiğine bir örnek verir. Sorun tahmini olan binom dağılımı her iki parametre bilinmemektedir. Örneğin, tüm hayvanları göremediğiniz zaman hayvan bolluğunu tahmin etmeye çalışırken ve görme olasılığı de bilinmediği görülüyor .Bin ( N , p ) pNBin(N,p)p


Bu örnekte çok hoş olan bir şey, durumu iletmek için çok basit olmasıdır - birçok kişi binom'a aşinadır (en azından her zaman isimle olmasa da konseptte).
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.