Dolu bir cam nesnesini algılama


10

Stackoverflow'daki bu sorudan buraya gönderildim , eğer soru çok spesifik geliyorsa ve buradaki tavırlarda değilse lütfen affedersiniz :)

Görev , içinde belirli bir sıvı bulunan bir cam bulmaktır. Size resimleri göstereyim ve sonra ne elde etmeye çalıştığımı ve resimlerin altındaki açıklamada şu ana kadar nasıl ulaşmaya çalıştığımı açıklayayım.

Resimler : (resim ve bağlantılar göndermek için en az 10 üne ihtiyacım var gibi görünüyor, bu yüzden bağlantılar yapmak zorunda kalacak :( aksi takdirde yığın taşma sorusuna bakabilirsiniz)

resim açıklamasını buraya girin

resim açıklamasını buraya girin

resim açıklamasını buraya girin

resim açıklamasını buraya girin

Ayrıntılı bir açıklama : Opencv'de belirli bir şekle sahip bir camı algılayacak bir algoritma uygulamaya çalışıyordum (cam farklı bir kamera çekim açısı / mesafesi ile dönüştürülebilir). Başka şekillerde başka bardaklar da olacak. Aradığım cam, diğer renkleri içeren camlardan ayıracak bazı renkli sıvılarla da doldurulacak.

Şimdiye kadar, camdaki bazı özellikleri bulmaya ve sonra içindeki camla diğer fotoğraflarla eşleştirmeye çalışmak için SIFT özellik çıkarıcısını kullanmayı denedim.

Bu yaklaşım sadece camın çok özel bir konumda olacağı ve arka planın öğrenme imgelerine benzeyeceği çok özel koşullarda çalıştı. Sorun da cam bir 3d nesne ve nasıl özellikleri (bu belki bir şekilde bağlı farklı açılardan birden fazla fotoğraf?) Ayıklamak bilmiyorum olmasıdır.

Şimdi başka hangi yaklaşımı kullanabilirim bilmiyorum. Bununla ilgili bazı ipuçları buldum (burada /programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338 ) ancak bağlantılar bozuk görünüyor.

Başka bir sorun, böyle bir camdaki farklı "boşluk düzeylerini" tespit etmek olacaktır, ancak camı bile düzgün bulamadım.

Bu görevdeki yaklaşımla ilgili önerileriniz nelerdir? Yerel 3B nesne özelliğini bulmak için farklı bir yol kullanmak daha iyi olur mu? Yoksa diğer yaklaşımları birlikte kullanmak daha mı iyi olur? Birden fazla fotoğraftan nesne "öğrenme" algoritmaları hakkında duydum ama ben pratikte bunu hiç görmedim.

Herhangi bir tavsiye gerçekten takdir edilecektir


C # tam kaynak kodu örneği ile herhangi bir son çözüm?
Kiquenet

vay bu oldukça özel bir istek. sorunun henüz bir çözümü yok ve bunu çözmek için daha fazla yatırım yapmayacağım. Burada bahsedilen makaleye göre, önerilen algoritmanın çok düşük hassasiyet oranlarına sahip olduğu için bilimsel zeminlerin de çok yakında bir çözümü olmayacağına inanıyorum. Her neyse, bu proje işim için olduğu için, görev bugünlerde tamamlanması gerçek olmadığından, bir müşteriyle uzlaşma hakkında tartıştım. "bir fincan gibi görünen herhangi bir şey" için normal haar benzeri özellik dedektörleri kullandı ve sonra birayı tespit etmek için sarı tonlar seçti. orijinal görev değil
user1916182

Yanıtlar:



0

Belki bu yazı size yardımcı olabilir: http://ai.stanford.edu/~ang/papers/iros09-ScalableLearningObjectDetectionGPU.pdf

Derinlik görüntüleri elde etmek için 2B görüntülere ek olarak aktif stereo sistemi kullanmasına rağmen, yama tabanlı özellikleri nasıl kullandıkları, nesnenin sözlüğünü çok küçük parçalarla nasıl oluşturdukları ve bir sınıflandırıcıyı nasıl eğittikleri ilginçtir. Belki de algılama oranınızı artırmak için bu özellikleri ekleyebilirsiniz.


Bu çalışmanın vahşi praksilerde çok iyi kullanılabileceğini düşünmüyorum. kağıtta açıklanan robot, derinlik bilgisini algılamak için bir derinlik sensörü gerektirir ... bir cep telefonunda falan fotoğraf çekerken bir kinect taşımak için çok pratik değil ... ama evet, yama tabanlı özellikler çok ilginç bir yaklaşım!
user1916182

-1

Yüz tanıma yazılımı söz konusu olduğunda bu konuda çok çalışma yapılmıştır. Örneğin, fotoğrafları etiketlerken Facebook'ta fark ederseniz, yüzlerin yeri kutlanır ve size önerilir.

Sinir ağları kullanan görüntülerde yüz tanıma hakkında çok sayıda literatür gördüm ve hızlı bir Google araması şüphesiz konu hakkında çok miktarda bilgi ortaya çıkaracaktır. Bu ağlar görüntünün piksellerini girdi olarak alır. Sizin durumunuzda, opaklığın değişmesinin / ışığın camdan yansıması, ağın öğreneceği özellikleri tanımlamak için iyi olabilir.

Sorunlardan biri, eğitim verisi olarak kullanmanız gereken fotoğraf sayısı ve bunların ön işlemesi (yani yüzleri kendiniz tanımlamak) olabilir. Ağınızı yeterince iyi eğitmek için yeterli görüntü için bunu yapmak mümkün değilse, öğrenme aşamasında bazı kısayollar aramak zorunda kalacaksınız. Bu yazı yapmak istediklerinizle ilgilidir: http://www.ll.mit.edu/publications/journal/pdf/vol04_no2/4.2.5.neuralnetwork.pdf

Neyse ki bu çok aktif bir alandır ve bu tür bir sorun için gerekli olan kodun çoğu çevrimiçi olarak mevcuttur.

Görüntülerdeki gözlükleri tanımlayabildiğinizde, oradan daha fazla analiz yapabilirsiniz.


bu tamamen ilgisiz
user1916182 7:18 '

İlginç olduğunu söylemelisin. Her neyse, sinir ağlarına dayalı olarak Facebook tarafından kullanılan algılama algoritmalarına bir bağlantı. İyi şanslar, github.com/facebookresearch/Detectron .
rwolst
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.