Popüler yatay çevirme, rastgele ekinler ve renk titremesi gibi veri artırımı yapmanın birçok yolu vardır. Dahası,
birden fazla farklı işlemin kombinasyonlarını deneyebilirsiniz, örneğin,
aynı anda dönme ve rastgele ölçeklendirme yapmak. Ayrıca
, tüm piksellerin
doygunluğunu ve değerini (
HSV renk uzayının S ve V bileşenleri ) 0,25 ile 4 arasındaki bir güce (
bir yama içindeki tüm pikseller için aynı) yükseltmeye çalışabilirsiniz , bu değerleri
0,7 ile çarpanı çarpın ve 1.4'ü ekleyin ve onlara -0.1 ile 0.1 arasında bir değer ekleyin.
Ayrıca,
görüntü / yamadaki tüm piksellerin tonuna ( HSV'nin H bileşeni) [-0.1, 0.1] arasında bir değer ekleyebilirsiniz .
Krizhevsky ve diğ. 1 , 2012 yılında ünlü Alex-Net'i eğitirken süslü PCA önerdi. Fantezi PCA
, eğitim görüntülerindeki RGB kanallarının yoğunluğunu değiştirir . Pratikte, öncelikle egzersiz görüntüleriniz boyunca RGB piksel değerleri kümesinde PCA gerçekleştirebilirsiniz. Ve
sonra, her egzersiz görüntüsü için,
her bir RGB görüntü pikseline aşağıdaki miktarı ekleyin (yani, I_ {xy} = [I_ {xy} ^ R, I_ {xy} ^ G, I_ {xy} ^ B] ^ T ):
[bf {p} _1, bf {p} _2, bf {p} _3] [alfa_1 lambda_1, alfa_2 lambda_2, alfa_3
lambda_3] ^ T burada, bf {p} _i ve lambda_i i-th özvektörü ve
özdeğeridir RGB piksel değerlerinin 3 kez 3 kovaryans matrisinin
ve alfa_i bir Gaussian'dan çizilen rastgele bir değişkendir
ortalama sıfır ve standart sapma 0.1 ile. Her
alfa_i'nin, belirli bir
egzersiz görüntüsünün tüm pikselleri için, bu görüntü tekrar eğitim için kullanılana kadar yalnızca bir kez çizildiğini lütfen unutmayın . Yani,
model aynı egzersiz görüntüsüyle tekrar karşılaştığında,
veri artırımı için rastgele başka bir alfa_i üretecektir. In 1 , onlar
o “Yaklaşık önemli yakalayabilecek fantezi PCA iddia
doğal görüntülerin özelliğini, yani o nesne kimlik şiddeti ve aydınlatma renk değişikliklerine değişmez” dedi. To
sınıflandırma performansı, bu şema üst-1 hata oranı azalır
IMAGEnet 2012 yarışmasında% 1'den fazla tarafından.