Bir görüntüdeki pikselleri sınıflandırmak için temel bir Markov Rasgele Alanı eğitimi


16

Bir görüntüdeki bölgeleri segmentlere ayırmak için Markov Rastgele Alanlarının nasıl kullanılacağını öğrenmeye çalışıyorum. MRF'deki bazı parametreleri veya neden yaptığım beklenti maksimizasyonunun bazen bir çözüme yaklaşamadığını anlamıyorum.

Bayes teoreminden başlayarak, , burada pikselin gri tonlama değeri ve bir sınıf etiketi. MRF kullanılarak modellenirken , için bir Gauss dağılımı kullanmayı seçtim .y x p ( y | x ) p ( x )p(x|y)=p(y|x)p(x)/p(y)yxp(y|x)p(x)

MRF için hem çiftli kırpma potansiyeline hem de sınıflandırılan pikselin sınıf etiketi için potansiyel bir değere sahip potansiyel bir fonksiyon kullanıyorum. Tek piksel potansiyel değeri, sınıf etiketine bağlı olan bir sabit değeridir . Çift bağlı potansiyel işlevler 4 bağlantılı komşular için değerlendirilir ve komşu bu pikselle aynı sınıf etiketine sahipse pozitif ve etiketler farklıysa döndürür .x β - βαxββ

Bekleme maksimizasyonunda , günlük olasılığının beklenen değerini en üst düzeye çıkaran ve değerlerini bulmak zorunda olduğum noktada sayısal bir optimizasyon yöntemi kullandım (konjuge gradyanı, BFGS, Powell'ın yöntemini denedim) ama her zaman değerinin negatif olacağını, çarpıcı bir şekilde artacağını ve bir veya iki veya daha sonra tüm görüntünün yalnızca bir etikete atanacağını (arka plan: MRF parametreleri verilen sınıf etiketlerinin atanması ICM kullanılarak yapıldı) . Alfaları kaldırdım, yani sadece çiftli klik potansiyellerini kullanarak, o zaman beklenti maksimizasyonu gayet iyi olurdu.β β αα(x)ββα

Lütfen her sınıf için alfaların amacını açıklayınız. Resimde mevcut olan bu sınıfın miktarı ile ilgili olacağını düşündüm, ama öyle görünmüyor. MRF'yi sadece ikili potansiyellerle çalıştırdıktan sonra, bunu düz ileri Gauss Karışım Modeli ile karşılaştırdım ve neredeyse aynı sonuçları ürettiklerini buldum. Sınıfları biraz düzeltmek için ikili potansiyelleri bekliyordum, ama olmadı. Lütfen nereye gittiğimi bildir.


Sadece merak ediyorum, neden yönlendirilmemiş grafik modelini seçtiniz?

Uygulamamda, piksel sayımlarının ve komşu piksellerin gri tonlama değerinin aynı sınıf etiketine sahip olma olasılığı daha yüksektir, ancak her çiftli klik için farklı bir beta kullanmanın herhangi bir nedeni yoktur. Umarım sorunuzu doğru anladım.
chippies

1
Sabit alfalar, etiketlerdeki önceki dağılımı modelleme amacına hizmet ediyor gibi görünmektedir. Tahmin ettiğiniz gibi, doğru alfalar eğitim setinde daha sık karşılaşılan etiketleri üst üste bindirecektir. Modeliniz onlarsız iyi çalışıyorsa, neden onları modelden düşürmüyorsunuz? Açıklamanız, alfaların neden büyüyüp her şeyi bozacağına cevap verecek kadar ayrıntılı değil, ancak muhtemelen düzenli hale getirmeniz gerekiyor. Modele alfadan önce gauss eklemeyi deneyin, yani log-posterior'a ekleyin , bu muhtemelen aşırı sığmayı önleyecektir. λα2
Roman Shapovalov

Sorunuz net değil: 1) p (y | x) olasılığınız pikseller üzerinde ayrışıyor mu, bu yüzden her biri için 1D gauss kullanıyor musunuz? 2) EM'de optimize ettiğiniz kesin hedef nedir (günlük olasılığından bahsettiniz, ancak daha önce modelleme için MRF kullanıyorsunuz)? 3) Logaritmik alandaki potansiyelleri tanımlıyor musunuz? Artan beta, P (x) veya -log P (x) olan enerji veya negatif enerji anlamına mı geliyor? 4) Bu tür dejenere alfaları ayarlayarak EM hedefini gerçekten azaltmayı başarıyor musunuz yoksa optimizasyon başarısız mı?
Roman Shapovalov

Döngüsel inanç yayılımı ne olacak?
wolfsatthedoor

Yanıtlar:


1

Teşhis

Bu bir başlatma sorunu gibi geliyor.

Kullandığınız MRF modeli dışbükey değildir ve bu nedenle birden çok yerel minimaya sahiptir. Bildiğim kadarıyla, mevcut tüm optimizasyon teknikleri başlatmaya duyarlıdır, yani son çözümün kalitesi optimizasyon prosedürünü başlattığınız yerden oldukça etkilenir.

Önerilen çözüm

Modeli başlatmak için farklı stratejiler denemenizi öneririm. Örneğin, aklıma gelen bir strateji şudur:

  1. önce için bir model eğitin ve şimdilik önceki terimi görmezden gelin; yani düzeltme bir ortamda, örneğin, tek tip olması ve bunları tutmak sabit . Meraklısı olmak istiyorsanız, yapabilirsiniz düzeltmek eğitim setinde etiketlerin göreli frekansları temsil eden mutinomimal dağıtım olmak. değerlerini uygun şekilde ayarlayarak bunu yapabilirsiniz .p(y|x) p(x)α=β=0 p(x)α

  2. çözülün HÖH modelinde tekli ve ikili terimleri; yani optimize edicinizin ve değerini değiştirmesine izin verin .αβ

Önerilen başlatma, hiçbir şekilde, optimizasyonunuzu başlatmanın en iyi yoludur, aksine sadece bir seçenek.

Son olarak, Roman Shapovalov'un önerdiği gibi, önceki parametrelerinizi düzenlemeyi düşünebilirsiniz; örneğin, önceden bir Gauss koyup: burada ve hiper parametrelerdir bu Gauss önceliklerinin varyansları olarak yorumlanabilir.λα||α||2+λβ||β||2λαλβ

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.