Gradyan tabanlı optimizasyon ve genetik algoritmanın bir kombinasyonunu kullanarak log-posterior'un küresel maksimumunu bularak MAP tahminini sağlam bir şekilde gerçekleştirebileceğimiz yüksek boyutlu bir çıkarım problemi (yaklaşık 2000 model parametreleri) üzerinde çalışıyorum.
MAP tahminini bulmanın yanı sıra, model parametreleri üzerindeki belirsizlikleri biraz tahmin edebilmek istiyorum.
Log-posteriorun gradyanını parametrelere göre etkili bir şekilde hesaplayabiliyoruz, bu yüzden uzun vadeli bazı örnekleme yapmak için Hamiltonian MCMC'yi kullanmayı amaçlıyoruz, ancak şimdilik örnekleme tabanlı olmayan tahminlerle ilgileniyorum.
Bildiğim tek yaklaşım, arkada çok değişkenli normal gibi yaklaşan modda Hessian'ın tersini hesaplamaktır, ancak bu bile, böyle büyük bir sistem için mümkün değildir, çünkü Hessian'ın unsurlarını eminim, tersini bulamadık.
Böyle durumlarda tipik olarak ne tür yaklaşımların kullanıldığını önerebilir mi?
Teşekkürler!
EDIT - sorun hakkında ek bilgi
Arka Plan
Bu, büyük bir fizik deneyi ile ilgili ters bir sorundur. Bazı fiziksel alanları tanımlayan bir 2D üçgen ağımız var ve model parametrelerimiz, ağın her köşesinde bu alanların fiziksel değerleridir. Kafes yaklaşık 650 köşeye sahiptir ve 3 alanı modelliyoruz, bu yüzden 2000 model parametrelerimiz geliyor.
Deneysel verilerimiz, bu alanları doğrudan ölçmeyen, ancak alanların karmaşık doğrusal olmayan işlevleri olan cihazlardan alınmıştır. Farklı enstrümanların her biri için model parametrelerini deneysel verilerin tahminleriyle eşleştiren bir ileri modele sahibiz ve tahmin ile ölçüm arasındaki bir karşılaştırma bir log-olasılık verir.
Daha sonra, tüm bu farklı enstrümanların günlük olasılıklarını özetliyoruz ve ayrıca alanlara bazı fiziksel kısıtlamalar uygulayan bazı günlük öncesi değerleri ekliyoruz.
Sonuç olarak, bu 'modelin' bir kategoriye düzgün bir şekilde düştüğünden şüpheliyim - modelin ne olduğu konusunda bir seçimimiz yok, gerçek enstrümanların deneysel verilerimizi toplaması nasıl işliyor.
Veri kümesi Veri kümesi
500x500 görüntüden oluşur ve her kamera için bir görüntü vardır, bu nedenle toplam veri noktaları 500x500x4 =.
Hata modeli
Sorundaki tüm hataları şu anda Gausslu olarak alıyoruz. Bir noktada, sadece ekstra esneklik için student-t hata modeline geçmeye çalışabilirim, ancak işler sadece Gaussyalılarla iyi işliyor gibi görünüyor.
Olasılık örneği
Bu bir plazma fiziği denemesidir ve verilerimizin büyük çoğunluğu plazmaya, ışık spektrumunun sadece belirli kısımlarına bakmak için lenslerin önünde belirli filtrelerle işaretlenmiş kameralardan gelmektedir.
Verileri yeniden oluşturmak için iki adım vardır; önce ağdaki plazmadan gelen ışığı modellemeliyiz, o zaman ışığı bir kamera görüntüsüne geri modellemeliyiz.
Plazmadan gelen ışığın modellenmesi maalesef, alanların farklı süreçler tarafından ne kadar ışık yayıldığını söyleyen, etkili bir şekilde oran katsayılarına bağlıdır. Bu oranlar bazı pahalı sayısal modeller tarafından tahmin edilir, bu nedenle çıktılarını ızgaralarda depolamamız ve daha sonra değerleri aramak için enterpolasyon yapmamız gerekir. Rate işlevi verileri yalnızca bir kez hesaplanır - bunu kod başlatıldığında ondan bir spline oluştururuz ve daha sonra bu spline tüm fonksiyon değerlendirmeleri için kullanılır.
varsaymak ve (enterpolasyon ile değerlendirdiğimiz) oran fonksiyonları, daha sonra örgünün tepe noktası tarafından verildi
Hatalar Gaussça olduğundan, bu kamera için günlük olasılığı
nerede kamera verisidir. Toplam günlük olasılığı, yukarıdaki ifadelerin 4'ünün toplamıdır, ancak hepsi oran işlevlerinin farklı sürümlerine sahip farklı kameralar için çünkü ışık spektrumunun farklı kısımlarına bakıyorlar.
Önceki örnek
Çeşitli miktarlarda belirli üst ve alt sınırları etkili bir şekilde belirleyen çeşitli önceliklerimiz var, ancak bunlar sorun üzerinde çok güçlü hareket etmiyor. Alanlara Laplacian tipi düzleştirmeyi etkili bir şekilde uygulayan, güçlü davranan bir öncekimiz var. Ayrıca bir Gauss formu da alır: