SIFT özellikleri ve SVM kullanarak görüntü sınıflandırma


12

Birisi SIFT / SURF / ORB özellikleri ve bir destek vektör makinesi kullanarak görüntü sınıflandırma gerçekleştirmek için kelime çanta modelini açıklamak umuyoruz?

Şu anda bir görüntü için SIFT özellik vektörlerini hesaplayabiliyorum ve bir SVM uyguladım, ancak SIFT özelliklerini 'vektör nicelleştirmek' ve veren histogramları oluşturmak için kelime torbası modelinin nasıl kullanıldığına dair literatürü anlamakta zorlanıyorum. SVM'yi eğitmek ve test etmek için kullanılabilen sabit boyutlu vektörler.

Konuyla ilgili herhangi bir öğretici veya edebiyat bağlantısı hoş geldiniz, teşekkürler

Yanıtlar:


16

Bir SVM uygulayabilirseniz, özellikleri ölçebilirsiniz. :)

Tipik olarak özellikler k-ortalama kümeleme kullanılarak nicelendirilir. İlk olarak, "kelime büyüklüğünüzün" ne olması gerektiğine karar verin (200 "görsel kelime" deyin) ve sonra bu kümeler için k-anlamına gelen kümeleme çalıştırırsınız (200). SIFT tanımlayıcıları 128 elementin vektörleridir, yani 128 boyutlu uzayı gösterir. Böylece, diğer noktalar gibi onları kümelemeyi deneyebilirsiniz. SIFT tanımlayıcılarını, özellik çantası kullanarak sınıflandırmak istediklerinize benzer çok sayıda görüntüden ayıklayabilirsiniz. (İdeal olarak bu ayrı bir görüntü kümesi olmalıdır, ancak pratikte insanlar genellikle eğitim görüntü kümelerinden özellikler alırlar.) Ardından, bu büyük SIFT tanımlayıcıları kümesinde 200 (veya her türlü) kümeye bölmek için k-ortalama kümeleme çalıştırırsınız. her bir tanımlayıcıyı bir kümeye atamak için kullanılır. k-means size 200 küme merkezi verecek,

Ardından görüntünüzdeki her bir SIFT tanımlayıcısını alır ve en yakın kümenin merkezini bularak 200 kümeden hangisine ait olduğuna karar verirsiniz. Ardından, her kümeden kaç özelliğe sahip olduğunuzu sayarsınız. Böylece, herhangi bir sayıda SIFT özelliğine sahip herhangi bir görüntü için 200 bölmeli bir histogramınız vardır. Bu, SVM'ye verdiğiniz özellik vektörünüzdür. (Not, özellikler terimi aşırı yüklenmiş).

Hatırladığım gibi, bu histogramların nasıl normalleştirilmesi gerektiğine dair birçok çalışma yapıldı. Yanılıyor olabilirim, ancak ikili özellik vektörünün (yani, bu kümeden en az 1 özellik varsa ve 0 ise) histogramdan daha iyi çalıştığını iddia eden bir makaleyi hatırlıyorum. Ayrıntılar için literatürü kontrol etmeniz gerekir ve ayrıntılar önemlidir.

Düzenleme: MATLAB için Bilgisayarlı Görme Sistemi Araç Kutusu artık çanta işlev işlevselliği sağlar .


Merhaba Dima, Cevabınız için teşekkürler, sadece bir sorum vardı, "o zaman bu sayıda küme için k-anlamına gelen kümeleme çalıştırıyorsunuz" derken, k-ortalama kümelemeyi ne yapıyorsunuz? ps Neredeyse aşırı terim özelliği terim hakkındaki yorumunuz için bu cevap kabul etmek için cazip, görüntü işleme için yeni ve daha katılıyorum olamazdı
Jono Brogan

@JonoBrogan: Cevabımı kabul etmelisin, çünkü doğru. :) K-araçlarını açıklığa kavuşturmak için cevabı düzenledim.
Dima

Şimdi mantıklı mı?
Dima

Evet, teşekkürler. Cevabı kabul ettim, ancak merak ediyorum, kaç tane "görsel kelime" kullanacağınıza nasıl karar vereceğinizi biliyor musunuz?
Jono Brogan

3
Ancak en büyük sorun Kmeans algoritmasının her zaman aynı sonucu vermemesidir. Büyük ölçüde rastgeledir.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.