CNN için görüntü yeniden boyutlandırma ve dolgu


14

Görüntü tanıma için bir CNN eğitmek istiyorum. Eğitim için resimlerin boyutu sabit değil. Örneğin CNN için giriş boyutunun 50x100 (yükseklik x genişlik) olmasını istiyorum. Bazı küçük boyutlu görüntüleri (örneğin 32x32) giriş boyutuna yeniden boyutlandırdığımda, görüntünün içeriği yatay olarak çok fazla uzatılıyor, ancak bazı orta boyutlu görüntüler için iyi görünüyor.

İçeriğin imha edilmesinden kaçınarak görüntüleri yeniden boyutlandırmak için uygun yöntem nedir?

(Genişlik ve yükseklik oranını belirli bir dereceye kadar yeniden boyutlandırdıktan sonra 0s ile görüntüleri tam boyutta doldurmayı düşünüyorum. Bu yöntemle sorun olmaz mı?)

Yanıtlar:


10

Stackoverflow hakkındaki bu soru size yardımcı olabilir. Özetle, bazı derin öğrenme araştırmacıları, görüntünün büyük bir kısmını doldurmanın iyi bir uygulama olmadığını düşünmektedir, çünkü sinir ağı, yastıklı alanın sınıflandırma için uygun olmadığını öğrenmelidir ve eğer örneğin enterpolasyon kullanın.


5

Birkaç seçeneğiniz var:

Küçük Resimler için:

  • enterpolasyon yoluyla örnek
  • görüntüyü sıfırlarla doldur

En boy oranını yukarı örnekleme yoluyla koruyamazsanız, fazla pikseli en büyük boyutta örnekleyebilir ve kırpabilirsiniz. Tabii ki bu veri kaybına neden olur, ancak ürününüzün merkezini tekrar tekrar değiştirebilirsiniz. Bu, modelinizin daha sağlam olmasına yardımcı olacaktır.


Büyük Görüntüler için:

  • altörnekleyebilirsiniz
  • giriş boyutunuza göre kırpın

Son olarak, Tam Konvolüsyon Ağı (FCN) kullanıyorsanız, görüntülerinizi yeniden boyutlandırmanız gerekmez.

TL; DR:

evet, sıfırlarla doldurmak geçerli bir seçenektir.


3 video çerçevesini birleştirilmiş olarak kabul eden tamamen evrişimsel bir ağ için ağırlık eğitmişsem, giriş ağırlığını 11 kareye yükseltmek dışında bu mimarileri aynı mimariye sahip bir ağ için nasıl kullanabilirim? Sadece tahminlerde bulunuyorum, daha fazla eğitim almıyorum. Benim sorum burada: datascience.stackexchange.com/questions/55737/…
mLstudent33

3

Aşağıdakileri yapabilirsiniz İlk olarak görüntüleri belirli bir boyutta yeniden boyutlandırın ve ardından görüntüyü, özelliklerin korunmasına yardımcı olabilecek şekilde her taraftan kaydırın.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.