Logo tespiti için AI veya Sinir Ağı kullanın


10

Bir video dosyasının içindeki bir TV kanalı logosunu tespit etmeye çalışıyorum, bu yüzden sadece bir giriş .mp4videosu verildi, bu logoun belirli bir çerçevede mevcut olup olmadığını tespit et, ilk kare mi, yoksa değil mi?

Bu logoya önceden sahibiz (% 100 aynı boyutta olmasa da) ve konum her zaman sabittir.

Zaten desen eşleme tabanlı bir yaklaşımım var. Ancak bu, desenin% 100 aynı boyutta olmasını gerektirir. Bunu başarmak için Derin Öğrenme ve Sinir Ağını kullanmak istiyorum. Bunu nasıl yapabilirim? CNN'in daha yüksek bir verime sahip olabileceğine inanıyorum?


1
AI'ya hoş geldiniz! Harika bir konu.
DukeZhou

1
@DukeZhou Tnx! Umarım bazı örnek kodlara işaretçilerle doğru cevaplar alırım.
Tina J

Yanıtlar:


5

Görüntü tanıma gerçekleştirmek için belirli özelliklere sahip bir görüntüyü temsil etmenin bir yolunu bulmalısınız.

İyi bir görüntü tanıma algoritmasının tanımlayıcı özelliklerinden biri, göze çarpan bölgeleri, yani en fazla bilgiyi içeren bölgeleri algılama yeteneğidir

Şu anda içerik tabanlı görüntü sınıflandırması için derin öğrenmeye çok dikkat edilmektedir. Görüntünün bir veya daha fazla özelliğini elde etmekten sorumlu olan üç veya daha fazla CNN katmanına sahip derin öğrenme uygulayarak iyi sonuçlar elde edebilirsiniz.


Teşekkürler. Ben kendim bir CNN adamı değilim. Ancak, bir logo görüntüsünün verildiği bir kaynak kodun işaretçisi var mı, var olup olmadığını tespit edebilir mi?
Tina J

3
Hey, Satoj Kovic'in Github'daki DeepLogo'ya göz atın. Python üzerine yazılmıştır ve marka logosunu tanımak için CNN'leri kullanır. Aşağıdaki bağlantıyı gönderdim. Şerefe. github.com/satojkovic/DeepLogo
Seth Simba

3

Video girişi olduğundan ve logolar genellikle sabit ya da donanım ya da yazılım tarafından canlı ya da kaydedilmiş çerçeveler üzerinde katmanlandığından, görev zor değildir. Logoların genellikle sınırlı renk paletleri ve keskin kenarları vardır. Yazı tiplerinin sözcükleri veya kısaltmaları hecelediklerinde özellikleri de genellikle tutarlıdır. Bunlar derin öğrenmede sömürülebilen genelliklerdir.

Bu yazar tarafından gönderilen diğer benzer soruda olduğu gibi, logoyu bulmak ve izole etmek için LSTM ve CNN katmanlarının bir kombinasyonu eğitilebilir. Bazı görüntü hileleriyle, logonun arkasındaki görüntü de benzer bir öğrenme teknikleri seti aracılığıyla logo çevresindeki piksellerden makul bir doğruluk ve güvenilirlikle yeniden oluşturulabilir.

Bunlar gelişim için birkaç başlangıç ​​noktasıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.