Bilgisayar görme algoritmaları (bu nasıl mümkün olabilir?)


9

Kısa bir süre önce, otomatik olarak hırsızlığı algılayabilen ve kullanıcılarını uyarabilen bir bilgisayar görme teknolojisi gibi görünen bir şirkete rastladım.

LİNK

Şirket tarafından sağlanan bazı videoları ve örnekleri izlemek beni tamamen şaşırttı ve bu işlevselliği nasıl elde edebileceklerine şaşırdı.

Buradaki hiç kimsenin bana bunun nasıl başarıldığını tam olarak anlayamayacağını, ancak bu alanda araştırma yapmanın farkında olduğunu ve beni işaret edebileceğini veya alternatif olarak bunun gibi bir şeyin nasıl uygulanabileceğine dair ayrıntılar sağlayamayacağını anlıyorum. nerede başlayabileceğine dair rehberlik?

Anladığım kadarıyla bilgisayar görme algoritmaları bu kadar sofistike olmaktan yıllarca uzaktı. Bu tür bir uygulama gerçekten mümkün mü? Bunu nasıl başardıklarını tahmin etmek isteyen var mı?


2
Bu o kadar zor görünmüyor. Oyunlar nesneler arasında her zaman çarpışmaları algılar; neden bir kişi ve bir eşya rafı arasındaki çarpışmaları tespit edemediniz ve sonra o kişi ödeme yapmadan kapıya doğru yürürken bir alarm veremediniz?
Robert Harvey

Kesinlikle. Sadece nesne tanıma ve çarpışma tespiti. Tarayıcıya takmadıkları sürece, nesneleri tarayıcının üzerine getirerek ancak biraz üstünden kolayca geçebilirler. Nesne tarayıcı ile çarpışmış gibi görünecek, ancak aslında olmadı.
Andrew T Finnell

Her neyse, web sitesinde açıklanan algılama mekanizmalarının hiçbiri (sevgililer, sepet kaybı ve kendi kendine ödeme), bu kadar karmaşık bir şeyi bile gerektirmiyor. Çok sınırlı bir alanda (kasiyer sayacı) kontrol ederler ve sepette görülen öğeleri barkod tarayıcının söylediği şeylere karşı kontrol edebilirler.
Robert Harvey

1
Üzgünüm kafam karıştı. Sweathearting örneğini ele alalım. İki ürünüm var, biri düşük maliyetli, biri yüksek. Düşük maliyetli ürünü yüksek maliyetli olanın altına koydum ve taradım. Bu noktada POS sisteminde tarananları kasiyerin elindeki kamerada görünenlerle karşılaştırabiliriz, ancak bu sistem yüz binlerce potansiyele karşı "torbaya ne konulduğunu anlayabilmeyi" gerektirir marjinal kalitede bir kamera ile öğeler. Bu son derece karmaşık görünüyor. Neyi kaçırıyorum?
Maxim Gershkovich

6
Bence bunun ne kadar iyi çalıştığını çok fazla varsayıyorsun. Bahse girerim iyi bir hata oranı vardır ve sistemi oynamak muhtemelen çok kolaydır. Bunu, videoda sadece insan incelemesine ihtiyaç duyan potansiyel yerleri tanımladığı bir düdük üfleyici tipi sistem olarak görüyorum. Bu nedenle, yanlışlık iyi tolere edilir.
chris

Yanıtlar:


5

Tekniğin son durumu hakkında yanlış bilgilendirildiniz. Birkaç yıl önce bu sistemleri çeşitli amaçlarla inşa eden bir şirkette çalıştım. Bunlardan biri, çıkış koridorunda yanlış yolda yürüyen bir kişi ile hareket halindeki toplar veya doğru yola giden insanlar arasındaki farkı kolayca anlayabilen son derece başarılı bir havaalanı çıkış kontrol sistemiydi. Bir sahnedeki nesneleri gerçek zamanlı olarak tanımak kolay değildir, ancak bunu süper bilgisayarlarda değil gömülü CPU'larda yapıyorduk.

Orada birkaç yıl önce inandırıcı olmayan hiçbir şey görmedim.


4

Aslında bu şirket Hindistan'da bir bilgisayar vizyonu ve manuel inceleme melezi kullanıyor. Özellikle sevgilim gibi unsurlar için saf bilgisayar görüşü değildir. Aslında, depoladığım sistem performansı nedeniyle değil, Hindistan'a bant genişliği nakliye videosu nedeniyle bu sistemle oldukça problemi olan bir perakendeci biliyorum. Bu manuel kodlama, hataları nasıl azalttığıdır ve şu anda bazı satıcılarla tipik bir teknik sorundur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.