Derin evrişeli sinir ağları için bazı yararlı veri güçlendirme teknikleri nelerdir?


13

Arka plan: Geçenlerde Geoffrey Hinton'un bu mükemmel konuşmasını gördükten sonra evrişimli sinir ağlarını eğitirken veri artırmanın önemini daha derinden anladım .

Mevcut nesil evrişimli sinir ağlarının test edilen nesnenin referans çerçevesini genelleştiremediğini ve bir ağın bir nesnenin yansıtılmış görüntülerinin aynı olduğunu gerçekten anlamasını zorlaştırdığını açıklar.

Bazı araştırmalar bunu düzeltmeye çalıştı. İşte birçok örnekten biri . Bence bu, evrişimli sinir ağlarını eğitirken günümüzde veri artışının ne kadar kritik olduğunu belirlemeye yardımcı oluyor.

Veri güçlendirme teknikleri nadiren birbirleriyle karşılaştırılır. Dolayısıyla:

Sorular:

  • Uygulayıcıların son derece daha iyi performans bildirdikleri bazı makaleler nelerdir?

  • Yararlı bulduğunuz bazı veri büyütme teknikleri nelerdir?


Merhaba @rhadar, hiç haberin var mı? Teşekkürler :)
nullgeppetto

Yanıtlar:


1

Sec. 1: Veri Büyütme Tatmin edici bir performans elde etmek için derin ağların çok sayıda egzersiz görüntüsü üzerinde eğitilmesi gerektiğinden, orijinal görüntü veri seti sınırlı egzersiz görüntüleri içeriyorsa, performansı artırmak için veri güçlendirmesi yapmak daha iyidir. Ayrıca, derin bir ağ eğitimi yapılırken veri artırımı yapılması gereken bir şey haline gelir.

  • Popüler yatay çevirme, rastgele ekinler ve renk titremesi gibi veri artırımı yapmanın birçok yolu vardır. Dahası,
    birden fazla farklı işlemin kombinasyonlarını deneyebilirsiniz, örneğin,
    aynı anda dönme ve rastgele ölçeklendirme yapmak. Ayrıca , tüm piksellerin
    doygunluğunu ve değerini (
    HSV renk uzayının S ve V bileşenleri ) 0,25 ile 4 arasındaki bir güce (
    bir yama içindeki tüm pikseller için aynı) yükseltmeye çalışabilirsiniz , bu değerleri
    0,7 ile çarpanı çarpın ve 1.4'ü ekleyin ve onlara -0.1 ile 0.1 arasında bir değer ekleyin.
    Ayrıca,
    görüntü / yamadaki tüm piksellerin tonuna ( HSV'nin H bileşeni) [-0.1, 0.1] arasında bir değer ekleyebilirsiniz .

  • Krizhevsky ve diğ. 1 , 2012 yılında ünlü Alex-Net'i eğitirken süslü PCA önerdi. Fantezi PCA
    , eğitim görüntülerindeki RGB kanallarının yoğunluğunu değiştirir . Pratikte, öncelikle egzersiz görüntüleriniz boyunca RGB piksel değerleri kümesinde PCA gerçekleştirebilirsiniz. Ve
    sonra, her egzersiz görüntüsü için,
    her bir RGB görüntü pikseline aşağıdaki miktarı ekleyin (yani, I_ {xy} = [I_ {xy} ^ R, I_ {xy} ^ G, I_ {xy} ^ B] ^ T ):
    [bf {p} _1, bf {p} _2, bf {p} _3] [alfa_1 lambda_1, alfa_2 lambda_2, alfa_3
    lambda_3] ^ T burada, bf {p} _i ve lambda_i i-th özvektörü ve
    özdeğeridir RGB piksel değerlerinin 3 kez 3 kovaryans matrisinin
    ve alfa_i bir Gaussian'dan çizilen rastgele bir değişkendir
    ortalama sıfır ve standart sapma 0.1 ile. Her
    alfa_i'nin, belirli bir
    egzersiz görüntüsünün tüm pikselleri için, bu görüntü tekrar eğitim için kullanılana kadar yalnızca bir kez çizildiğini lütfen unutmayın . Yani,
    model aynı egzersiz görüntüsüyle tekrar karşılaştığında,
    veri artırımı için rastgele başka bir alfa_i üretecektir. In 1 , onlar
    o “Yaklaşık önemli yakalayabilecek fantezi PCA iddia
    doğal görüntülerin özelliğini, yani o nesne kimlik şiddeti ve aydınlatma renk değişikliklerine değişmez” dedi. To
    sınıflandırma performansı, bu şema üst-1 hata oranı azalır
    IMAGEnet 2012 yarışmasında% 1'den fazla tarafından.

(Kaynak: Derin Sinir Ağlarında İpuçları / Püf Noktaları Bilmeli (Xiu-Shen Wei tarafından))

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.