Kısıtlanmış maksimum olasılık neden varyansın daha iyi (tarafsız) bir tahminini verir?


11

Ben karışık modellerin nitrit gritty daha iyi anlamak için R lme4 paketi üzerinde Doug Bates teori kağıdı okuyorum ve daha iyi anlamak istiyorum, varyans tahmin için sınırlı maksimum olabilirlik (REML) kullanma hakkında ilginç bir sonuç geldi .

REML kriteri 3.3 numaralı bölümde, varyans tahmininde REML kullanımının, monte edilmiş doğrusal bir modelde artık sapmalardan sapma tahmin edilirken bir serbestlik derecesi düzeltmesi kullanımı ile yakından ilişkili olduğunu belirtmektedir. Özellikle, "genellikle bu şekilde türetilmemelerine rağmen", serbestlik düzeltme dereceleri, bir "REML kriteri" optimizasyonu yoluyla varyansın tahmin edilmesiyle elde edilebilir (Denk. (28)). REML kriteri esasen sadece olasılıktır, ancak doğrusal uyum parametreleri marjinalleştirilerek ortadan kaldırılmıştır (bunları önyargılı örnek varyansı verecek uyum tahminine eşit ayarlamak yerine).

Matematiği yaptım ve sadece sabit etkileri olan basit bir doğrusal model için iddia edilen sonucu doğruladım . Mücadele ettiğim şey yorum. Uyum parametrelerinin marjinalleştirilme olasılığını optimize ederek bir varyans tahmini türetmenin doğal olduğu bazı perspektifler var mı? Sanki bir posterior gibi düşünüyor ve uyum parametrelerini rasgele değişkenlermiş gibi marjinalleştiriyor gibi Bayesian hissediyor.

Yoksa gerekçe öncelikle matematiksel midir - doğrusal durumda çalışır ama aynı zamanda genelleştirilebilir mi?

Yanıtlar:


4

Varyanstaki yanlılık, ortalamanın verilerden tahmin edildiği gerçeğinden kaynaklanmaktadır ve bu nedenle 'bu verilerin bu tahmini ortalama etrafına yayılması' (yani bu varyans), verilerin 'gerçek' ortalama etrafına yayılmasından daha küçüktür. . Ayrıca bkz: Standart sapmayı hesaplarken bölme için sezgisel açıklama ?n1

Sabit efektörler 'ortalama için' modeli belirler, bu nedenle, verilerden ortalamayı tahmin etmeden ('sabit etkileri (yani ortalama)' marjinalleştirerek ') elde edilen bir varyans tahmini bulursanız, bu az tahmin yayılma (yani varyans) hafifletilecektir.

Bu, REML tahminlerinin neden önyargıyı ortadan kaldırdığını 'sezgisel' anlamadır; "tahmini ortalama" yı kullanmadan varyans için bir tahmin bulabilirsiniz.


1

EK: Yazar David Dickey'in bu SAS ile ilgili kaynağından REML TAHMİN YÖNTEMİNİ inceleyin .

" Her zaman bilinen ortalama 0 ve n Y değerleri ile aynı kareler ve teorik varyans ile Z (n-1) sayılarını bulabiliriz. Bu, Z toplam karelerinin Zs sayısına bölünmesini m -1. "

Gradyan okulundayken, REML dilimlenmiş ekmekten beri en iyi şey haline getirildi. Lme4 paketini inceleyerek, o kadar iyi genellemediğini ve belki de şeylerin büyük şemasında o kadar önemli olmadığını öğrendim.


Belki de ... ilginç bir matematik ve istatistik.
Paul

1
Kabul ediyorum Paul. Bence REML, İstatistikte zarif ve yaratıcı problem çözmenin harika bir örneği. Kesinlikle pratikte kullanılıyor ve belki de istatistiksel araştırmalarda umduğunuz şey budur.
Ben Ogorek
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.