Derin Sinir Ağını Kullanarak Nesne Boyutunu Ölçme


10

Uzunluğunun temel gerçeğine sahip büyük bir araç veri setim var (100 binden fazla örnek). Araç uzunluğunu ölçmek / tahmin etmek için derin bir ağ oluşturmak mümkün müdür? Derin sinir ağı kullanarak nesne boyutunun tahmin edilmesiyle ilgili herhangi bir makale görmedim.


1
Çok güzel bir soru. AI'ya hoş geldiniz!
DukeZhou

(Moderatöre Not) - Bu, yorum yapamadığım için OP'ye soru sormak için bir yer tutucu cevabıdır. Veri kümeniz görüntüler veya metin mi? hisairnessag3, piksel / metrik yaklaşımı OpenCV'den nesne algılama DNN'ye taşıma ile doğru yolda
Adnan S

Yanıtlar:


4

Evet! Bu kesinlikle yapılabilir. Etiketli bir veri kümeniz olduğundan, bu her şeyi daha basit hale getirir!

Bu projeye bir göz atarım ve bu sizi gitmeniz gereken yere götürür.

Uygulama ayrıntıları oldukça basit olmalıdır. Daha fazla yardım edebilirsem bana bildirin.


1
Birinin neden oy kullanmadığını açıklamak gerekli değildir. Birçok programcı yorumlara bakmak için yeterli zamana sahip değildir, cevabın buna değip değmeyeceğini görmek için oylara bakarlar. Soruyu tekrar okursanız, sorunun özellikle DNN kullanmakla ilgili olduğunu ve başka bir şeyle ilgili olmadığını göreceksiniz. paylaştığınız proje Opencv'i kullanmakla ilgili ... paylaştığınız gönderinin altındaki yorumları okursanız, insanların DNN hakkında sorular sorduğunu, ancak gönderinin DNN kullanmadığını göreceksiniz. Bu arada ben senin cevabını
oylamayan

2
Gerekli değil ama yardımcı olur. Herhangi bir derinlikte arama yaparsanız, DNN'ler için bu özel kullanım durumunda hiçbir proje veya makale bulamazsınız. Bununla birlikte, OP'yi başlatma umuduyla mümkün olan en yakın projeye başvurdum. Ayrıca soruyu cevapladım. Soru bu yapılabilir mi?
hisairnessag3

Cevabınız için teşekkürler! Bence bu nasıl / neden mümkün olduğunun küçük bir açıklamasıyla daha da geliştirilecek. En azından mimarinin bir taslağı çok yardımcı olacaktır.
Ben N

1

Evet bu mümkün, ama önce tanımak gerekir bazı görüntüdeki nesneyi ya 1) aracın kendisi ve daha sonra bu aracın bilinen boyutunu bildirebilir veya 2) araba gibi kameradan aynı mesafeyi var bilinen bir nesne ( bir kaldırım, bir dur işareti, sürücü başı, bir midilli ... ne olursa olsun) ve sonra o nesneyi çok yakın olan aracın boyutunu kalibre etmek için kullanın.

Bir görüntüdeki herhangi bir araba, kameradan bilinmeyen bir mesafe olacaktır, bu da araba nesnesinin fotoğraftan fotoğrafa daha büyük veya daha küçük görünmesini sağlar. Arabayı veya en azından bilinen bir boyuta sahip bir referans nesneyi tanımıyorsanız, arabanın fiziksel boyutu kalibre edilmeyecektir - boyut tahmininiz için bir dayanağınız olmayacaktır.

Araba bilinmiyorsa, görsel ipuçlarınız olsa bile (mevcut bir referans nesnesi varsa veya kameradan arabaya olan mesafe biliniyorsa), kameranın merceğinin bilinmeyen geniş açılılığı bilinmeyen bir otomobilin şeklini bozabilir (yükseklik ve genişlik), görünür boyutlarını tahmin etme yeteneğinizi daha da karmaşık hale getirir.


Aracın plakası, aracın boyutunu kalibre etmek için kullanılan bilinen nesne olabilir mi? Plakalar genellikle aynı boyuttadır.
Naji

1
Plakaların aynı boyutta olmasını sağladığınız varsayımlara dikkat etmelisiniz. Örneğin, bir Avustralya plakası ve ABD plakası farklı boyutlardadır. Bu, uygulamanız için bir sorun değilse (yalnızca bir ülkede çalışır), plaka için bir referans boyutu olduğunu varsayabilirsiniz. Yine de dikkatli olmalısınız, çünkü plaka size normal olarak yönlendirilmeyebilir. Araç 45 dereceyse, plakanın genişliği aynı mesafede bile 0'dan daha az piksel alacaktır.
pshlady

1

Bu makalenin size yardımcı olabileceğini düşünüyorum: Derin Öğrenme ve Geometri Kullanarak 3D Sınırlayıcı Kutu Tahmini

Otomobillerin büyüklüğünü öğrenmek için 1 VGG-19 kullandı (ImageNet'te pretrained)


Sizin gibi, bunun verilerin bir 2D görüntüde temsil edildiği bir 3D sınırlama kutusunun çıkarılmasıyla ilgili olduğunu varsaydım. Hisairnessag3 tarafından belirtilen proje, yalnızca resmin içerebileceği 3D doğası hakkında öğrenilmiş çıkarımsal davranışı olmayan 2D sınırlama kutusunu ele almaktadır.
Jim

Bu kağıt, bir 2D kırpılmış görüntü (yalnızca istenen nesneyi içerir) kullanarak aracın boyutunu ve yönünü tahmin eder.
cryax dsa
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.