Özellikle derinlik görüntülerini hedefleyen herhangi bir bilgisayar görme algoritması var mı?


9

Kinect tabanlı bir uygulama ile kullanmak için marker algılama algoritmalarını araştırdım ve bulabildiğim işin çoğunluğu açıkça 'normal' görüntülerdeki özellik algılamaya odaklandı.

Bununla birlikte, kinect donanımı (esas olarak, ayarladıktan sonra) piksel başına 11 bit derinlik değeri sağlar.

Bu derinlik görüntüsünde ayrıca nesnelerin kenarları etrafındaki gölgelerden çeşitli görsel yapaylıklar da vardır (örneğin bu videodaki güçlü siyah kenarlığa bakın http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

Bazı geleneksel yapay görme teknikleri (örneğin kenar tespiti) bununla iyi sonuç verirken, diğerleri işe yaramaz ve ağda bunu tartışan çok az bilgi var gibi görünüyor.

Basit bir örnek olarak, derinlik değerini kullanmak, bir işaretçi bloğunun yerini belirledikten sonra yönünü algılamayı önemsiz hale getirir.

Öyleyse, özellik tespiti için derinlikli bir görüntünün işlenmesini kapsayan tartışmalar / makaleler / vb.

Herkes "derinlik" belirteçleri (yazdırılan s / b işaretçileri yerine etkili bir şekilde origami blokları) tespit etmek için iyi bir algoritma tavsiye edebilir misiniz?

Şimdiye kadar yaptığım, görüntüleri işlemek için opencv kullanarak geçici deneyler oldu, ancak bu yeterince kararlı veya hızlı bir yerde değil.

Herhangi bir deneme yapmadan ticari bir makine görme ürününe bağlanırsanız, lütfen cevabınızda neden bunun uygun olduğunu düşündüğünüzü belirtin.


Bunun için tonlarca makale ve program var. Üzgünüz, düşük bant genişliğinde daha ayrıntılı yanıt veremiyoruz. RGBDemo uygulamasına bakın, bir nesne tanıyıcı içerir. Ayrıca, yazılım için PointCloud Kütüphanesi (PCL), ROS, OpenCV ve kağıtlar için muhtemelen Google Akademik. OpenCV'nin sizin için tatmin edici olmadığını belirtiyorsunuz, ancak PCL ve RGBDemo olabilir.

Kinect'i gösteren bir demo uygulaması veya kinect veya görüntü işleme araç setinden (yani opencv) nasıl bir 3d model oluşturulacağını gösteren bazı PC demolarını aramıyorum. Derinlik görüntülerine dayalı özellik tanıma için algoritmalar arıyorum .

RGBDemo bu algoritmaları uygular. Kodu veya kodun referanslarını okuyun.

Yanıtlar:


8

Kayıt ve tanıma için en sevdiğim 2.5D / 3D özellik tanımlayıcı, spin görüntüsüdür (orijinal kağıt + doktora tezinde ve CMU'da bulunan yazılımda daha fazla ayrıntı ).

Diğer son gelişmeler (uygun algoritmalar için hepsi aranabilir on-line) şunları içerir: 3D Sift, Hızlı Nokta Özellik Histogramı, Normal Hizalanmış Radyal Özellikler (NARF), Derinlik Çekirdeği Tanımlayıcıları. Eski yöntemler, bölge yamalarını tanımlamak için eğrilik ve kenarlar gibi yüzey özelliklerini kullandı.

Hangisi en iyi? Ne bulmak istediğinize, bakış açısı değişmezliğine, ek dağınıklığa vb. Bağlıdır.


7

Tüm anahtar kelimeleri doğru buldunuz, materyal ararken gerçekten ilgili herhangi bir makale bulamadığınız için şaşırdım.

Neyse ki, IEEE Xplore dijital kütüphanesine erişimim var. Daha önce bu belirli algoritmaların herhangi birine ihtiyacım yok, ama çok ilginç görünüyor bu yüzden alakalı olabileceğini düşündüğüm hızlı bir aramadan bazı sonuçlar var (başlıklarına göre yargılamayın, özetlerine bakın):

Ne yazık ki, bu belgelerin hiçbirine ücretsiz olarak erişebileceğinizi düşünmüyorum, en azından IEEE Xplore kütüphanesi aracılığıyla değil. Erişiminiz yoksa, büyük olasılıkla Google bilginiyle anlaşabilirsiniz ve orada bazı ücretsiz kağıt veritabanları vardır ( henüz IEEE erişimim olmadığında Mendeley veritabanını kullandım ). Ayrıca, makalenin soyut veya rastgele bölümlerinin sadece Google bölümleri bazen bazı sonuçlar verebilir (makalenin neredeyse bitmiş, önceden yayınlanmış sürümlerine rastlayabilirsiniz).

Sözü edilen kağıtları bulmak için kullandığım arama sorguları şunlardı: 3D görüntü , derinlik görüntüsü , kinect . İlk iki sorguyu ararken işleme koyulmasını da isteyebilirsiniz .

Umarım bu yardımcı olur! Konuya daha fazla giremediğim için üzgünüm, gerçekten ilginç geliyor.



@mankoff sadece soyuttan, sadece izlemeye odaklanan işi görüyorum ve görünüşe göre çok fazla özellik tespiti olmadan doğrudan bilgileri kullanmaya odaklanıyor gibi görünüyor. Ama sonra, sadece özeti okudum, bu yüzden emin değilim.

Bildiri başlıklarının googling edilmesi, bu kağıtların birçoğu için PDF bulmak için yeterlidir. Başka iyi bir kaynak CiteSeer geçerli: citeseerx.ist.psu.edu/index kağıtlar listesi için teşekkürler!
Rethunk
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.