Bu yaklaşımla ilgili bir takım olası sorunları görebiliyorum. Burada yaşadığım tecrübeden, yaya sayım sistemini çok benzer bir yaklaşımla geliştirmekten söz ediyorum, bu yüzden cesaret kırıcı olmak istemiyorum. Aksine, doğru ve sağlam bir sistem oluşturmak için üstesinden gelmeniz gereken olası engeller konusunda sizi uyarmak istiyorum.
İlk olarak, arka plan çıkarma , ilgilenilen nesnelerin her zaman hareket edeceğini ve saymakla ilgilenmediğiniz nesnelerin tamamen hareketsiz kalacağını varsayar. Tabii ki, senaryonuzda durum bu olabilir, ancak yine de çok sınırlayıcı bir varsayımdır. Ayrıca arka plan çıkarımının aydınlatmadaki değişikliklere çok duyarlı olduğunu gördüm (geometrikal'e katılıyorum).
Yapım karşı dikkatli olun = Bir insan bir damla olduğu varsayımını , kendi çevre iyi kontrol edildiğini düşünseniz bile. İnsanlara karşılık gelen lekelerin hareket etmedikleri veya çok küçük oldukları için fark edilmeden çok sık oldu, bu nedenle erozyon veya bazı eşik kriterleri ile silindiler (ve inan bana, " her şeyi çalışana kadar eşikleri ayarlayın "tuzak. Çalışmıyor;)). Tek bir damla, birlikte yürüyen iki kişiye veya bir tür bagaj taşıyan tek bir kişiye karşılık gelebilir. Ya da bir köpek. Bu yüzden lekeler hakkında akıllı varsayımlar yapmayın.
Neyse ki, LBP'leri kişi tespiti için kullandığınızdan bahsettiğinizden, yukarıdaki paragrafta hata yapmamanın doğru yolunda olduğunuzu düşünüyorum. Yine de özellikle LBP'lerin etkinliği hakkında yorum yapamam. Ayrıca HOG'un (gradyanların histogramı) insanların tespitinde en son teknoloji ürünü bir yöntem olduğunu okudum, bkz . İnsan Tespiti için Yönlendirilmiş Degradelerin Histogramları .
Son sancı Camshift kullanmakla ilgili . Renk histogramlarına dayanır, bu nedenle, izleme penceresi yeterince büyük olduğu ve oklüzyon veya ani değişiklikler olmadığı sürece, renkle ayırt edilmesi kolay tek bir nesneyi izlerken güzel çalışır. Ancak, çok benzer renk açıklamalarına sahip olabilecek ve birbirine çok yakın hareket edecek birden fazla hedefi izlemeniz gerektiğinde, bir şekilde birden fazla hipotezi sürdürmenize izin veren bir algoritma olmadan yapamazsınız. Bu bir partikül filtresi veya MCMCDA (Markov Zinciri Monte Carlo Veri Derneği) gibi bir çerçeve olabilir, bkz . Çok Hedefli İzleme için Markov Zinciri Monte Carlo Veri Birliği). Birden çok nesneyi izlerken Meanshift'i tek başına kullanma deneyimim, izleme ile gerçekleşmemesi gereken her şeydir: parkuru kaybetmek, hedefleri karıştırmak, arka planda sabitlemek vb. Birden fazla nesne izleme ve veri ilişkilendirme sorunu hakkında biraz okuyun, bu Sonuçta birden fazla kişiyi saymanın kalbi ("olabilir" diyorum çünkü hedefiniz takip etmiyor sayılıyor, bu yüzden izlemeden geçerli olan akıllı bir yaklaşım olasılığını tamamen atmıyorum ...)
Son tavsiyem: belirli bir yaklaşımla yapabileceğiniz çok şey var ve daha iyi performans elde etmek için daha ince şeylere ihtiyacınız olacak (bu yüzden user36624 ile bu konuda katılmıyorum). Bu, algoritmanızın bir parçasını daha güçlü bir şeyle değiştirmek veya mimariyi tamamen değiştirmek anlamına gelebilir. Tabii ki, hangi süslü şeylerin sizin için gerçekten yararlı olduğunu bilmelisiniz. Sorunu ilkeli bir şekilde çözmeye çalışan yayınlar var, diğerleri ise belirli bir veri kümesi için bir algoritma buluyor ve sizden soruna gerçekten uygun olmayan bir sınıflandırıcıyı eğitmenizi bekliyor. birkaç eşiği de ayarlayın. İnsanlar sayma olduğudevam eden araştırmalar, bu yüzden işlerin kolayca gelmesini beklemeyin. Yeteneğinizin biraz ötesinde olan şeyleri öğrenmek için çaba gösterin ve ardından tekrar tekrar yapın ...
Herhangi bir çözüm sunmadığımı ve bunun yerine sadece yaklaşımınızdaki (hepsi kendi deneyimlerimden gelen) kusurları işaret ettiğimi kabul ediyorum. İlham almak için, yakın zamanda yapılan bazı araştırmaları okumanızı tavsiye ederim, örneğin Gerçek Zamanlı İzleme Videosu'nda Kararlı Çok Hedefli İzleme . İyi şanslar!