Nesne algılama, anlamsal bölümleme ve yerelleştirme arasındaki fark nedir?


Yanıtlar:


18

Nesne Tespiti, Nesne Tanıma, Nesne Segmentasyonu, İmge Segmentasyonu ve Semantik İmge Segmentasyonu hakkında birçok makale okudum ve işte doğru olmayan sonuçlar:

Nesne Tanıma: Belirli bir görüntüde tüm nesneleri (veri kümenize bağlı sınırlı nesne sınıfı) algılamanız gerekir, Bunları sınırlayıcı bir kutu ile etiketleyin ve etiketli sınırlayıcı bir kutu ile etiketleyin. Aşağıdaki resimde, son teknoloji ürünü nesne tanıma işleminin basit bir çıktısını göreceksiniz.

nesne tanıma

Nesne Algılama: Nesne tanıma gibidir, ancak bu görevde yalnızca iki nesne sınıflandırma sınıfına sahip olursunuz, bu da nesne sınırlayıcı kutuları ve nesne sınırlayıcı olmayan kutuları anlamına gelir. Örneğin, Araba algılama: Belirli bir görüntüdeki tüm arabaları sınırlayıcı kutuları ile tespit etmeniz gerekir.

Nesne Algılama

Nesne Segmentasyonu: Nesne tanıma gibi bir görüntüdeki tüm nesneleri tanıyacaksınız, ancak çıktılarınız görüntünün piksellerini sınıflandıran bu nesneyi göstermelidir.

nesne bölümlendirme

Resim Segmentasyonu: Resim segmentasyonunda resmin bölgelerini segmentlere ayıracaksınız. çıktınız, birbiriyle tutarlı bir görüntünün bölümlerini ve bölgesini etiketlemez, aynı bölüm içinde olmalıdır. Bir görüntüden süper pikselleri çıkarmak bu görevin veya ön plan arkaplan bölümlerinin bir örneğidir.

Resim parçalama

Semantik Segmentasyon: Semantik segmentasyonda, her pikseli bir nesne sınıfı (Araba, Kişi, Köpek, ...) ve nesne olmayan (Su, Gökyüzü, Yol, ...) ile etiketlemeniz gerekir. Anlamsal bölümlemede görüntünün her bölgesini etiketleyeceğiniz başka bir deyişle.

anlamsal bölümlendirme


güzel cevap. Cs231n.stanford.edu/slides/winter1516_lecture8.pdf slide 8'in aynı sınıftaki birden fazla sınıfı ve birden fazla örneği tespit eden farklı bir nesne algılama tanımı kullandığını not edeceğim (kabul edilen tek bir tanım olup olmadığını bilmiyorum, bu yüzden bu sadece belirsizlikten kaynaklanıyor olabilir).
Keith,

1
örnek bölümleme, anlamsal bölümleme gibi, ancak ineklerin ayrı olarak etiketlenmesi gerekir
titus

2
İlk yorumun slaytları şimdi burada: - cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf
Shatu

5

2019’da bile bu konu halen net olmadığı için ve yeni ML-Öğrenenlerin seçmelerine yardımcı olabileceği için, farklılıkları gösteren çok iyi bir resim:

(yerelleştirme, görüntünün sınıflandırılmasının ardından “koyun” sınıfı etrafındaki sınırlayıcı kutudur) kaynak: https://towardsdatascience.com/detection-and-segmentation-through-convnets-47aa42de27ea kaynak: Towardsdatascience.com


3

Sadece "yerelleştirme" nin "2B veya 3B sınırlayıcı bir kutu kullanarak tek nesne sınıflandırma + yerelleştirme" anlamına geldiğine inanıyorum.

"Nesne algılama", söz konusu bilinen nesne sınıflarının tüm örneklerini yerelleştirme + sınıflandırmadır.

Anlamsal Segmentasyon temelde piksel başına sınıflandırmadır.

Ayrıca, wrt dahil metrikler (kaynak: https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/ )

Kesinlik, doğru olarak tanımlanmış nesnelerin toplam öngörülen nesne sayısına oranıdır (gerçek pozitiflerin gerçek pozitiflere artı yanlış pozitiflere oranı).

Hatırlama, doğru şekilde tanımlanmış nesnelerin resimlerdeki toplam gerçek nesne sayısına oranıdır (gerçek pozitiflerin gerçek pozitiflere artı gerçek negatiflere oranı).

mAP: Hassasiyet ve DetectNet için geri çağırma ürününe dayanan basitleştirilmiş ortalama Ortalama Kesinlik puanı. Ağın ilgilenilen nesnelere ne kadar hassas olduğu ve yanlış alarmlardan kaçındığı için iyi bir birleşik ölçüdür.


2

Yerelleştirme terimi belirsizdir. Bu nedenle, nesne algılama ve anlamsal bölümleme terimlerini tartışacağım.

Nesne algılamasında, her görüntü pikseli belirli bir sınıfa ait olup olmadığı (örneğin yüz) olup olmadığı sınıflandırılır. Pratikte, sınırlayıcı kutular oluşturmak için piksellerin bir araya getirilmesiyle basitleştirilir, böylece sınırlayıcı kutunun nesnenin etrafına sıkı bir şekilde oturup uymadığına karar verme problemini azaltır. Pikseller birden çok nesneye (örneğin yüz, göz) ait olabileceğinden, aynı anda birden fazla etiket tutabilirler.

Öte yandan, anlamsal bölümleme, her görüntü pikseline sınıf etiketleri atamayı içerir. Sınırlayıcı kutu sadeleştirmesini içermedikleri için daha iyi yerelleştirme doğruluğu sağlarken, piksel başına kesinlikle tek bir etiket uygularlar.


-2

Anlamsal bölümleme: Aynı nesne sınıfına ait olan görüntülerin bir araya getirilmesi görevidir. örneğin: yol işaretlerini tespit etmek


2
Ancak yol işaretlerini tespit etmek nesne tespit etmektir. Farkı açıklayabilir misiniz?
reinierpost
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.