Çok değişkenli bir gaussianın kovaryans posterior dağılımını tahmin etme


15

Birkaç değişkenli bir iki değişkenli gauss dağılımını "öğrenmeliyim", ancak önceki dağıtımda iyi bir hipotez var, bu yüzden bayes yaklaşımını kullanmak istiyorum.

tanımladım:

P(μ)N(μ0,Σ0)
μ0=[00]   Σ0=[160027]

Ve dağılımım

P(x|μ,Σ)N(μ,Σ)
μ=[00]   Σ=[180018]

Şimdi sayesinde biliyorum burada veri verilen ortalama tahmin etmek için

P(μ|x1,,xn)N(μ^n,Σ^n)

Hesaplayabilirim:

μ^n=Σ0(Σ0+1nΣ)1(1ni=1nxi)+1nΣ(Σ0+1nΣ)1μ0

Σ^n=1nΣ0(Σ0+1nΣ)1Σ

Şimdi soru geliyor, belki yanılıyorum, ama bana öyle geliyor ki, , verilerimin tahmini kovaryansı değil , sadece tahmini parametresi için kovaryans matrisi . İstediğim şey de hesaplamak olurduμ nΣnμn

P(Σn1|x1,,xn)

verilerimden tam olarak belirlenmiş bir dağıtım elde etmek için.

Mümkün mü? hesaplamasıyla zaten çözülmüş ve sadece yukarıdaki formülün yanlış şekilde ifade edildi mi (ya da basitçe yanlış yazıyorum)? Referanslar takdir edilecektir. Çok teşekkürler.Σn

DÜZENLE

Yorumlardan, tarafından tanımlanan sabit bir kovaryans varsaydığım için yaklaşımımın "yanlış" olduğu ortaya çıktı . İhtiyacım olan şey daha önce de koymak, , ama hangi dağıtımı kullanmam gerektiğini ve daha sonra güncelleme prosedürünün ne olduğunu bilmiyorum.P ( Σ )ΣP(Σ)


Verilerinizin kovaryansını zaten belirttiniz ve güncellenmesi için önceden bir dağıtım belirtmediniz dan? Σ=[180018]
Corone

Senin değinmek istediğin noktayı anlıyorum. Benim yaklaşımımla temelde varyansın sabit ve belirlenmiş olduğunu varsaydım. Eğer tahmin etmek istersem, üzerinde bir önceliğe ihtiyacım var. Şimdi benim sorunum, onu ve bunun için uygun bir dağıtımın ne olduğunu tanımlayın, ancak bu ilk sorunun kapsamı dışında görünüyor. P(Σ)F(μΣ,ΣΣ)
unziberla

Sonra soruyu değiştirin :-)
Corone

Yanıtlar:


11

Kovaryans yapısı için Bayesian güncellemesini, ortalamayı güncellediğinizle aynı ruhla yapabilirsiniz. Çok değişkenli-normalin kovaryans matrisi için önceki eşlenik Ters-Wishart dağılımıdır, bu nedenle oradan başlamak mantıklıdır,

P(Σ)W1(Ψ,ν)

Sonra uzunluğundaki örneğinizi aldığınızda, örnek kovaryans tahminini hesaplayabilirsiniz. n Σ X = 1XnΣX=1n(Xμ)(Xμ)

Bu daha sonra kovaryans matrisi tahmininizi güncellemek için kullanılabilir

P(Σ|X)W1(nΣX+Ψ,n+ν)

Bunun ortalamasını kovaryans için puan tahmininiz olarak kullanmayı seçebilirsiniz (Posterior Ortalama Tahmincisi)

E[Σ|X]=nΣX+Ψν+np1

veya modu kullanmayı seçebilirsiniz (Maximum A Posteriori Estimator)

Mode[Σ|X]=nΣX+Ψν+n+p+1


Çok teşekkürler. Şimdi tahmin sürecimde bir şeyin değişeceğini varsayıyorum. İlk adım olarak, kovaryansını prosedürünüzle tahmin etmeliyim, sonra tahmini hipotez verilen dağılımım ve tahmin edildiğinden ve kendi dağıtımına sahip olduğundan, bunun bir şekilde hesaplamak için önceki formülümü değiştireceğinden eminim. (örnek varyansını kullanırken gauss MLE'de olduğu gibi). Σ^P(X|μ,Σ^)Σ^μ^n
unziberla

Açıkladığınız yaklaşım bunun yerine böylece kovaryans için daha önce biliyormuşum gibi gerçek bir değere sahibim. Sıkça kullanılan bir yaklaşımda, bu kulağa yanlış gelebilir, ama belki de öncekinin bilindiğini varsaydığım gerçeğinden eksik olduğum bir şey var ve bu prosedürü doğru hale getiriyor mu? Σ^=E[Σ|x1xn]
unziberla

7

Tamam, sorunum için gerçek çözümü buldum. Seçilen soruya (yanlış yerleştirilmiş) sorumun doğru cevabı olsa bile gönderiyorum.

Temel olarak, sorum kovaryansın ne anlama geldiğini nasıl tahmin edeceğimizi ve ortalamayı bilen kovaryansın nasıl tahmin edileceğini açıklıyor. Ama asıl sorunum her iki parametrenin de bilinmediği tahmin ediliyordu.

Burada açıklanan türetme ile Wikipedia'da cevabı buldum . Çok değişkenli normalin önceden eşlenik hali, temelde çok değişkenli Normallere göre bir dağılım olan Normal-ters-Wisharttır.

μ0Ψκ0ν0

np

P(μ,Σ|X)NIW(κ0μ0+nx¯κ0+n,κ0+n,ν0+n,Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)T)

nerede

x¯=1ni=0nxi

C=i=1n(xix¯)(xix¯)T

bu yüzden istenen tahmini parametrelerim

E(μ|X)=κ0μ0+nx¯κ0+n
E(Σ|X)=Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)Tν0+np1
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.