Sift, bir görüntüden özellikler çıkarmanın iyi bir yolu mudur?


13

Bir görüntüden özellikleri ayıklamaya çalışıyorum, ancak ayıklamak istediğim noktaları elde edemedim ve dolayısıyla görüntüm şablonla eşleşemiyor.

İyi sonuçlar alabilmek için resmime SIFT uygulamadan önce geçmem gereken herhangi bir kontrol noktası var mı? Örneğin şablon görüntüsü;
resim açıklamasını buraya girin

hedeflenen görüntü; resim açıklamasını buraya girin


1
Görüntünün türüne ve özelliklerini ne kullanmak istediğinize bağlıdır. Daha fazla bilgi lütfen.

Yanıtlar:


14

Bir şablonu sift kullanarak bir görüntüyle eşleştirirken yapmanız gereken şey, şablonunuza karşı sift çalıştırmak ve daha sonra sahnenizdeki o düzenlemedeki bu sift özelliklerini aramaktır.

Temel kural: Beğenmeyi karşılaştırın.

Eleme İçindeki Eleme (Şablon) (Resim)

Sift'i "istediğiniz özellikleri" ayıklayacak şekilde ayarlayamazsınız. Sift *, en dikkat çekici olduğuna inandığı özellikleri bulmak için değişmez önlemler kullanır. (* Chris A)

Şablonunuzdan belirli özellikler bulmasını istiyorsanız, bu özelliklerin daha küçük şablonlarını oluşturun ve arayın.

Sadece bir öneri. Ne tür bir sahneye veya görüntüye uymaya çalıştığınızı tam olarak bilmiyorum.


7
+1, katılıyorum. Bir şey dışında. SIFT en değişmez özellikleri bulamaz. En dikkat çekici olduğuna inandığı özellikleri bulmak için değişmez önlemler kullanır.

7

Sadece iki görüntüyü eşleştirmek (örneğin ortak noktaları bulmak) veya CBIR (İçerik tabanlı görüntü alma - bir şablon görüntüsüyle bir veritabanını aramak için nesne).

Şu anda CBIR araştırması yapıyorum, bu yüzden mevcut yöntemlerle oldukça güncelim. Burada ve burada stackoverflow gelen sizinkine benzer sorunlara benim cevaplara bağlantıları vardır, bir göz atmalısınız.

Şimdi, SIFT hakkında biraz konuşmak. Eğer zaman önce kişiye Lowe terimi SIFT özelliği sürecine yönelik olarak uygulanır algılama ve özelliği tanımlayıcıları bu tespit ilgi noktaları hesaplanır. Bu güne kadar, SIFT tanımlayıcılarının inanılmaz derecede harika olduğu kanıtlandı. Tanımlayıcılar @Totero'nun daha önce bahsettiği bazı harika özelliklere sahiptir.

Öte yandan, günümüzde gittikçe daha fazla DoG (Gaussianların Farkı) olarak adlandırılan SIFT tespit yöntemi artık en son teknoloji değildir. Halen yaygın olarak kullanılmaktadır, ancak özellik algılama süreci için, günümüzde bazıları daha iyi veya güzel DoG proses ekstraktlarının türlerini tamamlayan veya daha iyi tamamlayan daha fazla yöntem vardır.

Mevcut makalelerin çoğunun (bağlantılı yığın akışı sorularındaki bağlantılara bakın) daha iyi bir uygulaması vardır: özellikleri tespit etmenin birden fazla yolunu birleştirirler ve daha sonra değişmez vektör temsillerini hesaplamak için SIFT tanımlayıcılarını (hala tanımlayıcı olarak sallanır) kullanırlar. Şu anda DoG (görüntülerin köşe benzeri bölümlerine odaklanıyorlar) ve MSER bölgelerinin (çoklu ölçeklerle damla benzeri ayırt edici noktalara odaklanıyorlar) birlikte çalışıyorum. Bu kombinasyonu kendi görüntü veritabanınızda tatmin edici bulmazsanız, daha da fazla tür özellik dedektörü denemek ve denemek isteyebilirsiniz.

Eğer ilgileniyorsanız eğer Ayrıca, burada farklı algılama ve açıklayıcı kombinasyonlarının preformances değerlendiren bir kağıttır. Çünkü ben okumadım DoG & Mser + SIFT benim için para cezası çalışır, ama bunu yağsız ettik ve kağıt oldukça iyi.

Not: bağlandığım IEEEXplore veritabanına erişiminiz yoksa google bilgini kullanın.


sadece küçük bir açıklama: DoG Gaussian Farkı anlamına gelir (iki gauss filtre yanıtı arasındaki fark)
Libor

2

Önceki yanıtlara dayanarak:

(1) Dahili dedektör yerine yoğun örnekleme ile SIFT'yi (veya bu yerel yama tanımlayıcısının başka bir geliştirilmiş varyantını) kullanabilirsiniz. Performans ve hesaplama maliyeti gereksinimlerinize uyacak şekilde yerel yamanın boyutunu ve örnekleme yoğunluğunu seçebilirsiniz.

(2) SIFT, geniş taban çizgisi stereo eşleşmesi için bir afin değişmez tanımlayıcıdır. Bu, bir görüntü çekip ona afin dönüşümü indüklediğinizde SIFT'in iyi çalıştığı anlamına gelir; burada 'şablon', dönüşümlerle birlikte hedef görüntüde mevcut olmalıdır.

Öneriler: (a) Görüntüyü algılama şansınızı artırmak için (mümkünse) bir şablon görüntüleri veritabanı oluşturun.

(b) Görevinize bir CBIR yaklaşımı benimsemeyi seçerseniz, BoW modelini temel olarak kullanabilirsiniz.

(c) Şablon görüntünüzü yalnızca ilgili bölüme kırpın ve çok yoğun bir SIFT kullanın. http://www.vlfeat.org/overview/dsift.html

(4) Daha sonra, sonuçları potansiyel olarak iyileştirebilecek PHOG (Degradelerin Piramidal Histogramı) vb. Gibi çok ölçekli bir tanımlayıcıyı denemek isteyebilirsiniz. http://www.vlfeat.org/overview/dsift.html#tut.dsift.phow

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.