Ortalama ve varyans bilindiğinde, iki değişkenli normal verilerin kovaryansının maksimum olasılık tahmini nedir?


11

Ortalama olarak sıfır ve varyans olarak var olan iki değişkenli normal dağılımdan rastgele bir örneğimiz olduğunu varsayalım, bu yüzden bilinmeyen tek parametre kovaryanstır. Kovaryansın MLE'si nedir? gibi bir şey olması gerektiğini biliyorum ama bunu nasıl biliyoruz?1nj=1nxjyj


1
Bir başlangıç ​​olarak, aslında 0 ve 0 olduklarını bildiğimizde ve ile araçları tahmin etmenin biraz amca olduğunu düşünmüyor musunuz? x¯y¯
Wolfgang

Çok amca, düzeltti. Hala bunun nasıl kolayca takip edebileceğini göremiyorum. Örnek varyansına benzer, ancak neden MLE (bu değilse ve başka bir hata yapmadıkça)
Stacy

Silinmiş yazıldı ? Bu formülü kullanmak, ve araçların tahmini olarak gördüğünüz anlamına gelmez . 1ni=1n(xix¯)(yiy¯)x¯y¯
Stéphane Laurent

@ StéphaneLaurent Evet, ilk gönderide formül yazdığınız gibi verildi.
Wolfgang

Yanıtlar:


12

Korelasyon katsayısının tahmincisi (iki değişkenli bir standart normal durumda kovaryansa eşittir)

r~=1ni=1nxiyi

"Örnek Momentler Tahmincisi", örnek kovaryanstır. Bakalım maksimum olabilirlik tahmin ediciyle çakışıyor mu, .ρ^

Korelasyon katsayısı normal bir çift değişkenli standart ortak yoğunluk isimliρ

f(x,y)=12π1ρ2exp{x2+y22ρxy2(1ρ2)}

ve boyutu bir iid numunenin log olasılık, böylece olduğun

lnL=nln(2π)n2ln(1ρ2)12(1ρ2)i=1n(xi2+yi22ρxiyi)

(burada iid varsayımı, elbette iki boyutlu popülasyonun her çekilişi ile ilgilidir)

göre türevi almak ve sıfıra eşitlemek, cinsinden bir 3d derece polinom verir :ρρρ

ρ^:nρ^3(i=1nxiyi)ρ^2(11ni=1n(xi2+yi2))nρ^i=1nxiyi=0

Gerçek katsayısı -it olarak değerlendirilen türevin beklenen değerini alırsa, hesaplamaların doğru olduğu doğrulanabilir .ρ

Kompaktlık için, ve örnek varyanslarının toplamı olan . 1. türev ifadesini bölersek, MoM tahmincisi görünecektir, X Y n(1/n)i=1n(xi2+yi2)=(1/n)S2XYn

ρ^:ρ^3r~ρ^2+[(1/n)S21]ρ^r~=0

ρ^(ρ^2r~ρ^+[(1/n)S21])=r~

Cebir yaparak, edersek ve sadece, , yani sadece örnek varyanslarının toplamı eşitse, gerçek varyansların toplamı. Genel olarak (1/n)S2=2ρ^=r~(1/n)S2=2

ρ^r~

Peki burada ne oluyor? Birisi daha açıklayacaktır, şu an için bir simülasyon deneyelim: Korelasyon katsayısı ile iki standart normalden oluşan bir iid örneği oluşturdum . Örneklem büyüklüğü . Örnek değerlern = 1.000ρ=0.6n=1.000

i=1nxiyi=522.05,S2=1913.28

Momentler Yöntemi tahmincisi bize

r~=522.051000=0.522

Günlük olasılığına ne olur? Görsel olarak,

resim açıklamasını buraya girin

Sayısal olarak,

ρ1st derivlnL0.570.92783.650.5159.41782.470.5247.7781.480.5335.78780.680.5423.64780.10.5511.29779.750.561.29779.640.5714.1779.810.5827.15780.270.5940.44781.050.653.98782.18

ve log-olasılığının maksimum olarak biraz önce olduğunu görüyoruz burada da birinci türev sıfır olur . Değerleri için hiçbir sürpriz gösterilmemiş. Ayrıca, 1. türevin başka bir kökü yoktur.( ρ = 0,558985 ) ρρ=0.56(ρ^=0.558985)ρ

Dolayısıyla bu simülasyon, maksimum olabilirlik tahmin edicisinin moment tahmincisi yöntemine (iki rv arasındaki örnek kovaryans) eşit olmadığı sonucuna varır.

Ama öyle görünüyor ki "herkes" öyle diyor ki ... birileri bir açıklama yapmalı.

GÜNCELLEME

MLE'nin Momentler Yöntemi tahmincisi olduğunu kanıtlayan bir referans: Anderson, TW ve Olkin, I. (1985). Çok değişkenli normal dağılım parametrelerinin maksimum olabilirlik tahmini. Lineer cebir ve uygulamaları, 70, 147-171.
Burada tüm araçların ve varyansların değişmekte özgür olması ve sabit olmaması önemli midir?

... Muhtemelen evet, çünkü başka birinin (şimdi silinmiş) cevabındaki @ guy yorumu, verilen ortalama ve varyans parametreleriyle, iki değişkenli normalin kavisli üstel ailenin bir üyesi olduğunu söylüyor (ve böylece bazı sonuçlar ve özellikler değişir) ... ki bu iki sonucu uzlaştırmanın tek yolu gibi görünüyor.


1
Bu biraz şaşırtıcı, ama bazı yansımalardan sonra beklenmelidir. Sorun regresyon katsayısı tahmin olarak adlandırılabilecek edilebilir modelinde burada . Bu doğrusal bir model değildir, bu nedenle MLE'nin basit bir nokta ürünü olmasını beklemek için hiçbir neden yoktur. Aynı mantık gösterileri (sanırım!) Biz sadece biliyorsanız o sonra MLE olduğunu ve biz sadece biliyorsanız . Hiçbirini bilmezsek, MOM tahmincinizi alırız. Y = ρ X + ϵ ϵ N ( 0 , ρY=ρX+ϵVar(X)xy/xxxy/yyVar(Y)ϵN(0,1ρ22)Var(X)xy/xxxy/yyVar(Y)
Guy

1
@guy: Çok ilginç. Bence bu argümanlar biraz genişlediyse, ayrı bir cevap olarak gönderilmeyi hak ediyor!
amip

@guy Bu formülasyonun eşdeğer olduğunu düşünmüyorum, çünkü regresyon kurulumundaki log olabilirliği . İki değişkenli yoğunluk formülasyonunda eklenen katsayısı mevcut değildir. ϵ2=(yρx)2=y22ρxy+ρ2x2ρ2x2
Alecos Papadopoulos

Tahminim . Düşünün ve , daha sonra tahmini beklenmektedir. 1ni=1n(xix¯)(yiy¯)n=2y1=y20
Stéphane Laurent

1
@AlecosPapadopoulos . Terimi, payda iptal edilir , orijinal giriş-olasılıkla katkıda bulunur olan veriler sadece terimi, böylece . Ancak bu, iyi bilinen çarpanlara ayırma hemen sonra da , . Bunlara terimini dahil etmeyi ihmal ettiğim için diğer iddialarım yanlış . ( 1 - ρ 2 ) x 2 ,x2+y22ρxy=(1ρ2)x2+(yρx)2(1ρ2)x2(1ρ2)(yρx)2/(1ρ2)XN(μX,σX2)σY[Y|X]N(μY+ρXσYσX(XμX),σY|X21ρ22)σY/σX
Guy

2

Belirtilen koşullar altında ( ve ), boyutta rasgele örneği için olabilirlik fonksiyonu olduğuμX=μY=0σX=σY=1n

L(ρ|X,Y)=1(2π[1ρ2])n/2exp[12(1ρ2)(XX2ρXY+YY)].

Şimdi log-olasılık bulmak ve göre türev almak . Ardından, için çözerek 0'a ayarlayın . Bulduğunuz şeyin aslında küresel bir maksimum olduğunu göstermek için elbette uygun bir test yapmalısınız.p,ρρ^

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.