Bunun doğrudan veri toplama çabalarınızın ötesine geçmesi pek olası değildir.
Mevcut GAN çıkışlarının kalitesi (2017 itibariyle) yeterince yüksek olmayacaktır. Bir GAN tarafından üretilen görüntüler tipik olarak küçüktür ve olağandışı / belirsiz ayrıntılara ve garip bozulmalara sahip olabilir. Bağlı yazıda, bir cümleden sistem tarafından oluşturulan görüntüler konuyu verilen rengin inandırıcı blokları var, ama cümlenin olmadan çoğu olarak tanınabilir değildir ne olacağını size astar herhangi belirli bir konu.
Cümlelerden görüntü üretmekten daha az iddialı bir amaç olan GAN'lar (yukarıdaki eleştirilere rağmen, gerçekten dikkat çekici bir IMO) foto-gerçekçi görüntülere daha yakın üretmelidir. Ancak kapsamları daha az olacaktır ve muhtemelen istediğiniz görüntü türünü içermeyecektir. Ayrıca, tipik olarak çıktı boyutu küçüktür, örneğin 64x64 veya 128x128 * ve orijinal zemin gerçeği fotoğraflarının çok tercih edilebileceği yeterince bozulma ve belirsizlik vardır.
GAN'ın kendisi mevcut eğitim kütüphanesi ile sınırlıdır - eğitim verilerinin kapsamı dışında görüntüler oluşturmaya çalışırsanız iyi olmaz. Araştırma belgesinde gösterilen sonuçlar, elbette, eğitim verileri tarafından sağlanan alana odaklanmaktadır. Ancak bu modele herhangi bir cümle besleyemez ve başka bir yerde faydalı olacak bir sonuç bekleyebilirsiniz.
Sorununuz için uygun bir veri seti üzerinde eğitilmiş bir GAN bulursanız, büyük olasılıkla aynı verileri doğrudan projeniz için kaynaklamaya çalışmaktan daha iyi olursunuz.
Sınırlı zemin gerçeği verileriyle ilgili bir sorunla karşılaşıyorsanız, belki de bir GAN kullanmak için daha iyi bir yaklaşım, VGG-19 veya Inception v5 gibi önceden eğitilmiş bir sınıflandırıcı kullanmak, son birkaç tam bağlı katmanı değiştirmek ve ince verilerinize göre ayarlayın. Python'da Keras kütüphanesini kullanarak bunu yapmanın bir örneği - diğer örnekler "ince ayar CNN görüntü sınıflandırıcısı" gibi aramalarda bulunabilir.
* Bu yanıtı yayınladığımdan beri en son teknolojiye sahip GAN'lar daha iyi hale geldi. Nvidia'daki bir araştırma ekibi 1024x1024 foto-gerçekçi görüntüler oluştururken olağanüstü bir başarı elde etti . Ancak bu, cevabımdaki diğer noktaları değiştirmez. GAN'lar, görüntü sınıflandırması görevleri için güvenilir bir görüntü kaynağı değildir, ancak GAN'ın zaten eğitim gördüğü her şeyin alt görevleri dışında ve sınırlandırıcıları).