İçeriğe dayalı görüntü alma için olası görüntü özelliklerinin listesi


15

Görüntülerde aynı / benzer nesneleri bulma durumunda kullanılabilirliklerini ölçmek için renk, yönlendirilmiş kenarlar ve benzeri olası görüntü özelliklerinin bir listesini bulmaya çalışıyorum. Böyle bir liste veya en azından bazı özellikler bilen var mı?


Bu konu dışı ama CBIR, Open Image veri kümesinden özellik çıkarabilir mi? Görüntü yerel diske kaydedilmemiş olsa bile bir görüntünün özelliğini çıkarmak mümkün mü?
Quix0te

Yanıtlar:


25

Alanın kendisi çok geniş. Burada tam kapsamlı bir listeniz olabileceğinden şüpheliyim. Bununla birlikte, MPEG 7 bu alanı standartlaştırmak için birincil çabalardan biridir. Yani burada yer alan şey evrensel değil, en azından birincil.

İşte MPEG7'de tanımlanan bazı temel özellik setleri (Gerçekten sadece Görsel Tanımlayıcılar hakkında konuşabilirim, diğerleri bunu tam kapsam için göremez ).

Görsel Tanımlayıcıların 4 kategorisi vardır:

1.
Aşağıdakileri içeren Renk Tanımlayıcıları : Baskın renk,
Renk Düzeni (temelde blok öbek temelinde birincil renk)
Ölçeklenebilir Renk (temelde Renk histogramı),
Renk Yapısı (temelde yerel Renk histogramı)
ve işleri birlikte çalışabilir hale getirmek için Renk uzayları.

2. Aşağıdakileri içeren Doku Tanımlayıcıları (ayrıca buna bakın ):
Doku Tarama Tanımlayıcısı - tanecikliği / iri taneliği, düzenliliği ve yönü tanımlar. Homojen Doku Tanımlayıcı - Gabor filtre bankasına dayanır. ve
Kenar Histogramı

3. tanımlayıcılarla içerir:
Bölge göre tanımlayıcıları söz konusu şekil skalar özelliklerini olan - vb ecentricities alanı olarak
esas kontur olan yakalar gerçek karakteristik şekil özellikleri ve
3D tanımlayıcıları

4. Video
Kamera Hareketi için Hareket Tanımlayıcılar (3 boyutlu kamera hareket parametreleri)
Hareket Yörüngesi (sahnedeki nesnelerin) [örn. İzleme algoritmaları ile çıkarılır] Parametrik Hareket (örneğin, sahne hareketinin açıklanmasına izin veren hareket vektörleri. çeşitli nesnelerde daha karmaşık modeller olabilir).
Daha çok semantik bir tanımlayıcı olan etkinlik.


MPEG 7 "Bunların nasıl çıkarıldığını" tanımlamaz - sadece ne anlama geldiklerini ve nasıl temsil edileceğini / saklanacağını tanımlar. Bu nedenle, bunların nasıl çıkarılacağı ve kullanılacağı konusunda araştırmalar var.

İşte bu konuda fikir veren başka bir iyi makale .

Ancak evet, bu özelliklerin çoğu oldukça basittir ve daha fazla araştırma daha karmaşık (ve karmaşık) özellik kümesi oluşturacaktır.



6

Bu konuyla ilgili bir dizi makaleyi bir araya getiren bir kitap da var. Buna Görsel Bilgi Alma İlkeleri denir .


Kitaplar hakkında Googleing yapmak pek çok olumlu yorum ortaya çıkarmaz. Aslında olumlu daha fazla şikayet. Yine de bunun iyi bir referans olduğunu düşünüyor musunuz ve eğer öyleyse, bize ne zaman faydalı olduğunu söyleyebilir misiniz? :)
penelope

Buraya koymanın temel nedeni, çok fazla kullanmam değil, ama öğretmenim önerdi (ve fikrine değer veriyorum). Bu konuda Googleing, bunun gerçekten bir kitap değil, bir kağıt paketi olduğunu gösteriyor. Aynı zamanda oldukça eski ama yine de konuyla ilgili birkaç kitaptan birini gösteriyor. Dolayısıyla cevabımın hala uygun olduğunu düşünüyorum.
Geerten

3

@Dipan Mehta kullanılabilecek özellik tanımlayıcılarını ele aldı . Şimdi CBIR için iyi özellikler elde eden bazı özellik algılama yöntemlerinden bahsederek madalyonun diğer tarafını kapatalım .

CBIR araştırmam için referansım Sivic, Zisserman ve Nister, Stewenius'un makaleleriydi . Bu yazarlardan daha fazla güncel makale var, ancak bunlar ilgili tüm fikirleri sunuyor.

Etkili bir CBIR yöntemlerini uygulamak için tamamlayıcı özelliklerin özelliklerinin kullanılması gerektiğini savunuyorlar:

  • Şekil Uyarlanmış bölgeler - köşe benzeri özelliklerdeortalanma eğilimindedir

    Örnekler: Harris köşeleri, çok ölçekli Harris, DoG (Gaussianların Farkı - ama aynı zamanda kenarlara cevap veriyor!)

  • Maksimal Kararlı bölgeler - damla benzeri özelliklereodaklanma eğilimindedir

    örnekler: MSER (Maksimal Kararlı Dış Bölgeler), DoG

Şaşırtıcı bir şekilde, Wikipedia ayrıca, yaygın olarak kullanılan özelliklerin çoğu için tespit ettikleri ilgi bölgelerinin türünü belirten iyi bir özellik (dedektör) türü sınıflandırması sunar:

  • kenar dedektörleri
  • köşe dedektörleri
  • damla dedektörleri
  • sırt dedektörleri

Okuduğum güncel makalelerin çoğu, SIFT (Ölçek değişmez özellik dönüşümü) tanımlayıcılarının sallandığına yemin ediyor ve seçilen özellik dedektörleri ile birlikte kullanmak için yeterince sağlam. Kaynaklar:

  • zaten sağlanan bağlantılar
  • Mikolajczyk, Schmid yerel tanımlayıcıların karşılaştırılması ile ilgileniyor
  • Dahl dedektör-tanımlayıcı kombinasyonlarını değerlendirir

Not! bu belgelerin kesinlikle CBIR ile ilgilenmediği, ancak CBIR ile ilgili çalışmalarda referans olarak kullanıldığı .

Son olarak, başarılı CBIR yöntemlerinin sadece kullanılan özellik dedektörlerine ve tanımlayıcılara bağlı olmadığını , ayrıca:

  • verimli bir arama yapısı (görsel özelliklerin niceliği)
  • Görüntü tanımlayıcıları oluşturmanın yolu - ortak görsel özelliklere (yerel tanımlayıcılar) dayalı olarak veya global görüntü tanımlayıcılarını karşılaştırarak (bu çok yeni bir fikirdir, bu nedenle şu anda referans yok)
  • görüntü tanımlayıcıları arasındaki mesafe ölçüsü

Ayrıca, DSP ve stackoverflow ile ilgili CBIR ile ilgili bazı soruları zaten yanıtladım , her ikisine de referanslar ve açıklama eşlik ediyor ve alakalı olabileceğini düşünüyorum, bu yüzden bir göz atmak isteyebilirsiniz:

  • DSP: 1
  • yığın akışı: 1 , 2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.