Görüntülerdeki araba modellerini tanımak için iyi özellikler / algoritmalar


9

Nesne tanıma, özellikle araba modellerini tanıma ile ilgili bir sorum var! Aynı araba modelini farklı görüntülerde tanımlama konusunda bir çalışmanın başındayım. Şu anda 3D nesne tanıma için en iyi algoritmalardan birinin SIFT olduğunu düşünüyorum, ancak bir demo uygulamasıyla biraz oynadıktan sonra, bu algoritmanın otomobiller gibi parlak metal nesnelerle bazı sorunları olduğunu, özellikle de farklı renklere sahip olduklarında garip bir his var.

Farklı görüntülerde aynı araba modelini bulma görevi için genel olarak bu alan üzerinde bazı çalışmalar yapan uygun algoritmalar var mı?

Yardımınız için şimdiden teşekkürler!


2
Bazı örnek resimler gönderebilir misiniz?
Mart'ta endolit

Elbette. Araba modelleri ;-) modeli oluşturmak için resimler şöyle olabilir: s5 coupe training 1 veya s5 coupe training 2 gibi ama aynı zamanda 'normal' resimler. Sorgu görüntüleri yardımcı olur s5 coupe sorgu 1 umut gibi olabilir !
jstr

Arabalardaki uygun anahtar noktaları belirlemek için SIFT, GLOH veya SURF gibi alternatif Özellik Dedektörleri nelerdir?
jstr

@jstr Aşağıda açıklanan şemayı uyguladıysanız, ne kadar iyi çalıştı?
solvingPuzzles

Yanıtlar:


7

"Sözler çantası" veya "görsel kelimeler" yaklaşımına bir göz atarım. Görüntü kategorizasyonu ve tanımlaması için giderek daha fazla kullanılmaktadır. Bu algoritma genellikle bir görüntüde SIFT noktaları gibi sağlam noktaları tespit ederek başlar. Bulunan bu noktaların çevresindeki bölge (davanızdaki 128 bit SIFT tanımlayıcı) kullanılır.

En basit biçimde, tüm tanımlayıcılardan tüm veriler tüm görüntülerden toplanabilir ve kümelenebilir, örneğin k-araçları kullanılarak. Her orijinal görüntü, bir dizi kümeye katkıda bulunan tanımlayıcılara sahiptir. Bu kümelerin sentroidleri, yani görsel kelimeler, görüntü için yeni bir tanımlayıcı olarak kullanılabilir. Temel olarak, tanımlayıcılarının katkıda bulunduğu bir görüntünün kümelerinin, görüntü kategorisini göstereceğini umuyorsunuz.

Yine, en basit durumda, bir kümeler listeniz vardır ve görüntü başına, bu kümelerden hangisinin o görüntüden tanımlayıcılar içerdiğini ve kaç tanesini hesaplarsınız. Bu, metin alımında kullanılan Terim Sıklığı / Ters Belge Sıklığı (TD / IFD) yöntemine benzer. Bu hızlı ve kirli Matlab komut dosyasına bakın.

Bu yaklaşım aktif olarak araştırılmıştır ve etrafında çok daha gelişmiş algoritmalar vardır.

VLfeat web sitesi , caltech 101 veri kümesini sınıflandıran bu yaklaşımın daha gelişmiş bir demosunu içerir. Ayrıca dikkate değer, Caltech'in kendisinin sonuçları ve yazılımıdır .


Hey Maurits, cevabınız için teşekkür ederim. Bunu düşüneceğim! Ama bir soru. Eğer 'görsel kelimeler' varsa aralarındaki mesafeyi nasıl ölçerim? Sanırım SIFT tanımlayıcılarını kullanmak doğru mu? - Lowe, SIFT tanımlayıcılarının modellerini oluşturarak 3D nesneleri tanımak için bir yöntem tanımladığı bir makaleye sahiptir. Bu konu hakkında başka iyi makaleler bilen var mı (diğer özelliklerle 3B nesne tanıma)?
jstr

Bu durumda, tamsayı vektörlerini kümelediğiniz için sadece öklid mesafesi. Küme sentroidleri arasındaki mesafeyi kendiniz ölçmek zorunda değilim, daha ziyade, bir sorgu görüntüsü (ve böylece sorgu tanımlayıcıları) ile sunulduğunda, bu tanımlayıcıların en yakın olduğu hangi sentroidleri ölçün.
Maurits

Tamam bir mesafe ölçüsü kullanarak açık ;-) ama hangi verilerde? Görsel kelime başına SIFT Tanımlayıcılarında?
jstr

Aslında, üç kez, ilk kümeleme için bir metrik olarak, bir sorgu tanımlayıcının en çok hangi centroid / visualword olduğunu belirlemek için ve son olarak, td / idf vektörünü veritabanındakilerle karşılaştırmak için.
Maurits

Tamam ;-) aldım ama mesafe ölçüsü hangi veriler üzerinde çalışıyor? SIFT tanımlayıcılarında?
jstr
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.