Görüntü Tanıma


11

Ticari kullanımın, bilinen tek varyasyonların olacağı devasa ve organik olarak büyüyen 2-D görüntü koleksiyonunda görüntü tanıma yapmasına izin veren açık kaynaklı bir sistem aramak:

  • Görüntünün ölçekleme boyutu,
  • Resmin resminin açısı,
  • Renk senkronizasyonu ofsetleri, yani bir kaynak görüntü renginin yakalanması ve oluşturulmasındaki düzensizlikler nedeniyle örneklemden örneğe değişiklik gösterir,
  • Fotoğrafın kırpılması,
  • Filigran veya metin eklenmesi,
  • Olası odak varyasyonları, yani yakalamanın odakta olmadığı, bir görüntü işleme filtresinin uygulanmadığı anlamına gelir.

Uygulamayı eğitmek zorunda olduğum için iyiyim, çünkü bunun getirisi işe yarayacaktır - bu, uzun vadeli 2-D örneğinin sayısının ilk birkaç binten yüze çıkmasını beklediğini söyledi. binlerce; ancak bu uzun vadelidir ve 1000 örneklik bir eğitim seti ve örnek başına 10 örnekle iyi bilinen bir çözüme sahip olmaktan memnuniyet duyarım.

GÜNCELLEME: Lisansın, ikili koda sahip olanların tümüne bile kaynak kodunu yayınlamadan ticari iç dağıtım için kullanılabilmesi gerekir. Kod asla satılmaz, sadece dahili olarak kullanılır, ancak her kullanıcının kaynak koduna erişimi yoktur, sadece arayüz.


2
OpenCV'yi düşündünüz mü?

+1 @pwny: Teşekkürler - yani hayır, herhangi bir bilgisayar görme (CV) sistemini hiç denemedim, sadece sorun hakkında düşünme şeklimin doğru olup olmadığı hakkında bir fikir edinmeye çalıştım. Görüntülerin ne olduğunu belirtecektim, ancak bir iş girişimi ile ilgili ve CV sistemi sadece dahili kullanım için olacağından, sistemin ne işleyeceğini belirtmemeye çalışıyorum, ancak karşılaştığı zorluklar karşı karşıya kalacak. OpenCV mevcut gereksinimleri karşılıyorsa, lütfen bir cevap olarak gönderin ve mümkünse sağlanan işlevsel gereksinimleri kapsayan ilgili dokümanlara bağlanmaya çalışın. Tekrar teşekkürler!

1
Telif hakkı yasasına göre "iç dağıtım" diye bir şey yoktur. Bu nedenle, lisansların çoğu (tüm bildiğim) bu konuda kısıtlamalarla uğraşmaz.
MSalters

+1 @MSalters: Teşekkürler, "telif hakkı yasasına göre" bağlantınız var mı?

1
@blunders: Teknik olarak, tüzel kişiye (örneğin bir şirkete) gerçek bir kişi gibi davranılması gerektiğini belirleyen TRIPS (Madde 1.3) 'den alınmıştır.
MSalters

Yanıtlar:


10

Biraz düşük seviyeli olabilir , ancak OpenCV size böyle bir görüntü tanıma yazılımı oluşturmak için ihtiyacınız olan araçları sağlayabilir. Tabii ki, OpenCV kutudan ihtiyacınız olan her şeyi sağlamaz (sanırım, profesyonel değilim), ancak gerçek zamanlı bilgisayar görüşü için gerekli olanı sağlamayı amaçlamaktadır.

Buradaki belgeleri okumaya başlayabilirsiniz . Bazı iyi kitaplar da bu sayfada listelenir.

Umarım bu yardımcı olur, iyi şanslar!


OpenCV'nin GPLV2 lisansı, kapalı kaynak sistemde dahili olarak dağıtılamadığı anlamına mı geliyor? Teşekkürler!

GPLV2 lisansını nerede görüyorsunuz? Ana sayfadaki ilk paragrafta BSD lisansı olarak listelenir.

@deterb: Altbilgide, sayfanın en altında.

@deterb: GPL bağlantısının OpenCV için değil, OpenCV için wiki için kullanılan MoinMoin Wiki Motoru için olduğunu görün - hatamı belirttiğiniz için teşekkürler!

+1 @pwny: Belirtildiği gibi, OpenCV, web sitesi ana sayfasında belirtilen bir BSD lisansı altındadır (GPLV2 lisansı altbilgisinin OpenCV için geçerli olmadığını gösterir), OpenCV'yi ve arama arama lisansını indirerek bunu doğrulamaya çalıştı. tüm dosyaları; diğer üçüncü taraf lisansları arasında dönen, BSD lisansı şeklinde OpenCV için görünen bir lisans, ancak bunun BSD lisansı olduğunu belirtmez. Yani, devam ederseniz, cevabınız büyük bir yardımdır ve ilerlemek için yeterince iyi görünüyor. Teşekkürler!


2

Sadece tartışmaya eklemek için şu anda resim eşleştirme üzerinde çalışıyorum ve OpenCV'nin ORB'sinin ücretsiz olduğunu gördüm ; ancak SURF ve SIFT değildir. Bu örneğe olası bir başlangıç ​​noktası olarak bakabilirsiniz .


1

Pastec http://www.pastec.io ilk sorunun gereksinimlerini karşılamalıdır.

Bu bir olan açık kaynak LGPL altında dağıtılan görüntü tanıma dizini ve arama motoru. Basit bir HTTP API kullanarak kolayca dizindeki eşleşen görüntüleri eklemenizi, kaldırmanızı ve aramanızı sağlar. OpenCV'ye dayanır ve SURF ve SIFT'den farklı olarak patent içermeyen ORB tanımlayıcısını kullanır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.