Günümüzde en yaygın Görüntü Segmentasyon teknikleri


11

Görüntü segmentasyon teknikleri hakkında biraz okuma yapıyordum ve modern, modern segmentasyon algoritmalarını merak ediyordum.

'Okunması gereken' olan şu andaki segmentasyon teknikleri, yani şu anda toplulukta en yaygın olarak kullanılan nedir? Hangi tekniklerle temas kurdunuz ve en etkili ve yararlı buldunuz (ve hangi uygulama için)?


Şimdiye kadar nereye baktın?
Phonon

1
Seviye ayarlama yöntemleri ve Hızlı yürüyüş yöntemlerine ek olarak Normalleştirilmiş Kesimler, Grafik Kesimleri, Min Kesimler hakkında bazı okumalar yapıyorum.
GamingX

3
Güzel ve kısa, Kasım 2012'den itibaren: Görüntü Bölümleme: Bir Gözden Geçirme .
Emre

(düzenleme, bu sorudan ilham alarak ilham alabilir, belki bu soru segmentasyon yöntemlerine benzer bir referans olabilir)
penelope

Yanıtlar:


7

Birçok segmentasyon tekniği hakkında bir bilgim yok, ancak tatmin edici bir segmentasyon üretmek için daha fazla incelenebilecek segmentasyon parçalarının "seçimini" sunan yapılarla uğraşıyorum.

İnşallah başka biri hakkında çok şey bilmediğim en son teknoloji ürünü segmentasyon yöntemi hakkında yazabilir.

Farklı bir görüntü için segmentasyon seçimlerinin veya seviyelerinin neden güzel olduğuna dair küçük bir giriş: segmentasyon, kötü tanımlanmış bir sorundur. Temel gerçek mevcut değildir: istenen sonuçlar her zaman kullanıcının gereksinimlerine ve özelliklerine bağlıdır. Güzel bir teklif:

Sabit bir görüntü için bile , bir segmentasyonun kalitesini tanımlayan kriterler uygulamaya bağlı olduğundan birden fazla "en iyi" segmentasyon olabilir . Bu durum, araştırmamızı, belirli kullanıcı gereksinimlerini karşılayan bir segmentasyon oluşturmak için kullanılabilecek (...) "puzzle parçaları" sunan görüntü bölümleme teknikleri üzerine odaklamaya motive etti.

( P. Soille: Hiyerarşik Görüntü Partisyonlama'ya ve Kolaylaştırma Kısıtlı Bağlantısı (2008) )

Orada hiyerarşik yapıları , hiyerarşik görüntü ayrıştırma değişen karmaşık olan görüntü bölümleri öneriyoruz. Bu yapılar, en basit olarak, her düğümün görüntüdeki bir bölgeyi temsil ettiği ağaç yapıları olarak temsil edilir. Yapılarla ilgili fikir:

  • yapının yaprakları ince bir bölümün bölgeleri veya bir görüntünün aşırı bölümlenmesi (örn. pikseller, düz bölgeler - aynı yoğunluktaki bağlı bölgeler, havza )
  • ağaçtaki bağlantılar (komşu) bölgelerin birleşmesini veya birleşmesini ve daha karmaşık bir bölge oluşturmayı temsil eder ve nesnelere karşılık gelen bölgeler üretme olasılığı en yüksek olan şekilde inşa edilir (umarım :))
  • bölgelerin karmaşıklığı her dal boyunca düğümlerden ağacın köküne doğru artar
  • ağacın her seviyesi (ayrıca, her kesim) bir görüntünün bölümlenmesi / bölümlere ayrılmasıdır (köküne daha yakın)
  • ağacın kökü tüm görüntü alanını kapsar

Daha segmentasyon oluşur bölgelerin ve önerilen birliklerini, inceleme tespit ağaç bölgeleri veya ağaç kesme gerekli tekabül eden ilgilenilen bir nesne ya da başka önceden tanımlanmış kullanıcı özellikleri hakkında hassas ya da bazı bilinen özellikleri.

Bu özelliklere sahip ağaçlar (yani, hiyerarşik görüntü ayrışmaları) şunlardır:

Daha önce sunulan makalelere bağlantılara ek olarak, bu tür segmentasyon teknikleri hakkında daha spesifik ve daha az spesifik güncel makaleler:

(daha pratik):


1
"Modern" (ve modaya uygun) segmentasyon algoritmik aileleri için süper pikseller eklerdim. Bu terim için googling yapmak gerçekten etkileyici.
sansuiso

@sansuiso Peki, bir cevap olarak ekleyin :) Umarım bu soruya birkaç ilginç modern segmentasyon yaklaşımı toplayabiliriz
penelope

6

Penelope'un cevabına bir ek olarak , iki popüler algoritma ailesi (ve modaya uygun).

Superpixels

Superpixels adı verilen çok popüler bir algoritma ailesi şu anda çok popüler (CV konferanslarında bazı Superpixel oturumları bile var). Süper pikseller aşırı segmentasyona çok benzer (havzanın size verdiği gibi), bu nedenle bazı post-processing gereklidir.

Süper pikseller küçük homojen görüntüler bölgeleri olarak görülebilir . Pikseller arasındaki mesafe, iki taraflı filtrelemede olduğu gibi değerlendirilir, yani, uzaysal mesafeleri ile görsel benzerlikleri arasında, birbirine yakın ve benzer olduklarında 0'a, aksi takdirde daha büyük bir değere giden bir karışımdır.
Daha sonra süper piksel yöntemleri, bu ölçüme göre küçük homojen bölgeler oluşturmak için çeşitli kriterler dener. Birçoğu var (grafik tabanlı, mod arama / kümeleme tabanlı ...), bu yüzden sizi bu teknik rapora yönlendirmek en iyisi .

(değiştir :) Birisinin yayınlanmış hakemli bir eser araması durumunda, bu makale aynı yazarlar tarafından yazılmıştır ve teknik raporla aynı materyali kapsar: R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, S. Susstrunk: En Gelişmiş Süper Piksel Yöntemleriyle Karşılaştırıldığında SLIC Süper Pikselleri

Cevabın ilk versiyonunu yazdığımda, görsel olarak sonuçların havza aşırı bölümlemesinin size sağladığı şeye çok benzediğini unutmayın. Bu, ilgili çalışma bölümünde havzaları içeren teknik raporun yazarları tarafından onaylanmıştır. Bu nedenle, aynı post-processing'i de yapmanız gerekir: süper pikseller piksel yerine kullanmak için kullanışlı özellikler olsa da, nesneleri izlemeniz / algılamanız gerekiyorsa daha üst düzey bölgeler oluşturmak için yine de gruplandırılması gerekir.

Grafiğe dayalı segmentasyon yöntemleri

Bir başka popüler algoritma ailesi, piksel ilişkisinin, yani piksellerin görünüşlerinde ne kadar yakın olduklarının analizinden gelir. Bu, normalleştirilmiş kesim gibi grafik teorisi tabanlı bir segmentasyon yöntemleri ailesi verir (J. Shi, J. Malik: Normalized Cuts ve Image Segmentation ) .

İşte bu yaklaşımın sezgisi: Diyelim ki pikselleriniz artık yüksek boyutlu bir grafiğin noktaları (köşeleri).
Grafikte, iki köşe , ağırlığı köşeler arasındaki bir mesafeyle ters orantılı olan bir kenarla birleştirilebilir . Tipik olarak, ağırlık fonksiyonu, iki taraflı filtrelemede, uzamsal mesafeleri ve görsel benzerlikleri 8as arasındaki bir karışımın karşılıklı olacaktır). Daha sonra, bu grafik göz önüne alındığında, segmentasyon algoritmaları en iyi köşe kümelerini, yani küçük bir grup içi mesafeye ve büyük bir ekstra grup mesafesine sahip köşe gruplarını arayabilir .

Normalize Kesim yaklaşımında, kümelerin farklı popülasyon boyutlarının getirdiği yanlılığı önlemek için bazı ek özen gösterilmektedir. Ayrıca, grafik teorisinde bağlantı matrisi olarak da bilinen ağırlık matrisinin SVD'sinin hesaplanmasıyla grafik keşfinden kaçınılabilir .


Hey, biraz zaman aldı, cevap için teşekkürler, ama ... bahsettiğin 2 tekniğin en azından birazını genişletebilir misin? Onları burada ayrıntılı olarak açıklamak istemiyorum, ama bunların her biri hakkında bir veya iki tanımlayıcı cümle gerçekten takdir ediyorum.
penelope

Cevabı genişlettim. Yine de biraz kafa karıştırıcı, en iyisi cevapta bağlantılandırdığım teknik rapora atıfta bulunmaktır (süper piksel bir adam olmadığımı itiraf etmeliyim ve hala ilgileri hakkında biraz şüpheliyim, ancak gerçekten modaya uygun).
sansuiso

Grafik tabanlı segmentasyon yöntemleri için, bu çalışmanın en iyi sonuçlardan birini önerdiğini düşünüyorum: study.microsoft.com/pubs/167600/jmiv_bnm_final.pdf Bu sezgisel bir kağıttır ve kod mevcuttur.
Tolga Birdal

3

Sanırım en son anketlere bakmak için segmentasyon için en son teknoloji algoritmalarına genel bir bakış. Szeliski'nin Kitabında zorluklarla ilgili küresel bir genel bakış sunulmaktadır .

resim açıklamasını buraya girin

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.