Maksimum değişkenliği kullanarak çok değişkenli normal model takarken kovaryans matrisinin özellikleri nasıl sağlanır?


22

Diyelim ki aşağıdaki modelim var

yi=f(xi,θ)+εi

buradaki , , açıklayıcı değişkenlerin bir vektörüdür, , doğrusal olmayan fonksiyonunun ve nın parametreleridir , burada doğal olarak matrisi.yiRKxiθfεiN(0,Σ)ΣK×K

Amaç ve tahmin etmek her zamanki gibidir . Belirgin seçim maksimum olabilirlik yöntemidir. Bu model için log olabilirliği (bir örneğimiz olduğunu varsayarsak )θΣ(yi,xi),i=1,...,n

l(θ,Σ)=n2log(2π)n2logdetΣi=1n(yif(xi,θ))Σ1(yf(xi,θ)))

Şimdi bu basit gibi görünüyor, log olasılığı olabilir, veri koyulur ve doğrusal olmayan optimizasyon için bazı algoritmalar kullanılır. Sorun, Σ kesin olarak kesin olmasını sağlamaktır . Örneğin optimR'de (ya da diğer herhangi bir doğrusal olmayan optimizasyon algoritmasında) kullanmak, Σ pozitif olarak kesin olduğunu garanti etmez .

Öyleyse soru Σ pozitif olarak kesin kalmasını nasıl sağlayacağınız ? İki olası çözüm görüyorum:

  1. Reparametrise Σ olarak RR' R, üst üçgen veya simetrik bir matristir. O zaman \ Sigma her zaman pozitif-kesin olacaktır ve R kısıtlanamaz.RRRΣR

  2. Profil olasılığını kullanın. θ^(Σ) ve \ hat {\ Sigma} (\ theta) için formülleri türetin Σ^(θ). Bazı \ theta_0 ile başlayın θ0ve yineleyin Σ^j=Σ^(θ^j1) , θ^j=θ^(Σ^j1) yakınsamaya kadar.

Başka bir yolu var mı ve peki ya bu 2 yaklaşım, işe yarayacak mı, standart mı? Bu oldukça standart bir problem gibi görünüyor, ancak hızlı arama bana herhangi bir işaret vermedi. Bayesçi tahmininin de mümkün olacağını biliyorum, fakat şu an için bunun içinde yer almak istemem.


Kalman algoritmasında da aynı sorunu yaşıyorum, ancak problem çok daha karmaşık ve Hamilton hilesini kullanmak kadar kolay değil. Acaba daha basit bir şeyin basitçe kullanıp kullanmayacağını merak ediyorum . Bu şekilde kodu bir hata vermemeye zorluyorum ve çözümü değiştirmedim. Bu aynı zamanda, bu terimi olasılığın son kısmıyla aynı işarete sahip olmaya zorlama yararına da sahiptir. Herhangi bir fikir? log(detΣ+1)
econ_pipo

Yanıtlar:


6

Kovaryans matrisi oluşturulmasında, otomatik simetri sayısında dikkat çekici olduğunu varsayarsak, sizin log-olabilirlik olacak çünkü pozitif kesin değildir terimin model değil mi? Sayısal bir hatayı önlemek için, eğer ı ön hesaplama olur pozitif değilse ve daha sonra logaritmik değeri aksi devam -Inf eşit olun. Belirleyiciyi yine de hesaplamanız gerekir, bu nedenle bu size fazladan bir hesaplamaya mal olmaz. Σ log d , e t Σ d , e t Σ < 0 d , e t ΣΣlogdet Σdet Σ<0det Σ


5

Sonuç olarak, gerekli özellikleri sağlamak için maksimum olasılık profilini kullanabilirsiniz. Sen Verilen için kanıtlayabilirim , maksimize edilir l( θ ,Σ)θ^l(θ^,Σ)

Σ^=1ni=1nε^iε^i,

nerede

ε^i=yif(xi,θ^)

O zaman bunu göstermek mümkün

i=1n(yif(xi,θ^))Σ^1(yf(xi,θ^)))=const,

bu yüzden sadece maksimize etmemiz gerekiyor

lR(θ,Σ)=n2logdetΣ^.

Doğal olarak bu durumda gerekli tüm özellikleri yerine getirecektir. İspatlar lineer olduğu durum için aynıdır ve JD Series sayfa 295'teki Zaman Serisi Analizi'nde bulunabilir , bu yüzden onları ihmal ettim.fΣf


3

Kovaryans matrisi için alternatif bir parametrelendirme, özdeğerleri ve "Givens" açılarında . p ( p - 1 ) / 2 θ i jλ1,...,λpp(p1)/2θij

Yani yazabiliriz

Σ=GTΛG

burada , ortonormal veG

Λ=diag(λ1,...,λp)

ile .λ1...λp0

Bu arada, , açıları, , yani ve . [1]p ( p - 1 ) / 2 θ i j i = 1 , 2 , . . . , P - 1 j = i , . . . , p - 1Gp(p1)/2θiji=1,2,...,p1j=i,...,p1

(eklenecek detaylar)

[1]: Hoffman, Raffenetti, Ruedenberg. "Euler Açılarının N ‐ Boyutlu Ortogonal Matrislere Genelleştirilmesi". J. Math. Phys. 13, 528 (1972)


matrisi aslında ortogonaldir, çünkü simetrik bir matristir. Bu benim yaklaşım - Temelde vektörünü ve model işlevini döndürmekle tutar böylece hataların bağımsız olması için daha sonra döndürülen bileşenlerin her birine (sanırım) OLS uygulanır. Σ y i f ( x i , θ )GΣyif(xi,θ)
Olasılık

2

Charles.y.zheng çözümünü uygun bir bağlamda, modele isteyebilirsiniz , bir köşegen matristir ve için bir sıra güncellemenin Choleskey çarpanlara olan . Sadece o diyagonal tutmak için gereken tutmak için pozitifliği pozitif kesin. Olduğuna göre, diyagonal tahmin etmelidir ve unsurlarını yerine tahmin . Λ C Λ Λ Σ Λ C ΣΣ=Λ+CCΛCΛΛΣΛCΣ


Bu ayarlardaki diyagonal öğelerin altında, diyagonal pozitif olduğu sürece istediğim herhangi bir şey olabilir mi? Matrisleri bu şekilde numpy olarak simüle ederken hepsi pozitif olarak kesin değildir.
sztal

Λ köşegen bir matristir.
shabbychef
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.