Kinect tabanlı bir uygulama ile kullanmak için marker algılama algoritmalarını araştırdım ve bulabildiğim işin çoğunluğu açıkça 'normal' görüntülerdeki özellik algılamaya odaklandı.
Bununla birlikte, kinect donanımı (esas olarak, ayarladıktan sonra) piksel başına 11 bit derinlik değeri sağlar.
Bu derinlik görüntüsünde ayrıca nesnelerin kenarları etrafındaki gölgelerden çeşitli görsel yapaylıklar da vardır (örneğin bu videodaki güçlü siyah kenarlığa bakın http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Bazı geleneksel yapay görme teknikleri (örneğin kenar tespiti) bununla iyi sonuç verirken, diğerleri işe yaramaz ve ağda bunu tartışan çok az bilgi var gibi görünüyor.
Basit bir örnek olarak, derinlik değerini kullanmak, bir işaretçi bloğunun yerini belirledikten sonra yönünü algılamayı önemsiz hale getirir.
Öyleyse, özellik tespiti için derinlikli bir görüntünün işlenmesini kapsayan tartışmalar / makaleler / vb.
Herkes "derinlik" belirteçleri (yazdırılan s / b işaretçileri yerine etkili bir şekilde origami blokları) tespit etmek için iyi bir algoritma tavsiye edebilir misiniz?
Şimdiye kadar yaptığım, görüntüleri işlemek için opencv kullanarak geçici deneyler oldu, ancak bu yeterince kararlı veya hızlı bir yerde değil.
Herhangi bir deneme yapmadan ticari bir makine görme ürününe bağlanırsanız, lütfen cevabınızda neden bunun uygun olduğunu düşündüğünüzü belirtin.