Generatif Düşman Ağları ile büyük veri kümesi oluşturabilir miyiz


15

Eğitim için derin sinir ağımı besleyecek yeterli veri kümesini (görüntüler) bulamadığım bir sorunla uğraşıyorum.

Scott Reed ve ark. Tarafından yayınlanan Generator Adversarial Text to Image Synthesis adlı makaleden çok etkilendim . Jeneratör Düşman Ağları.

Mevcut küçük veri kümesini bir GAN modeline girdi olarak kullanabilir ve daha derin ağ modelleri ile başa çıkmak için çok daha büyük bir veri kümesi oluşturabilir miyim?

Yeterince iyi olacak mı?


GAN'ı görüntü olmayan veri kümeleri için kullanabilir miyiz?
Mohamed EL-KADDOURY

@ MohamedEL-KADDOURY evet tabii, ses arxiv.org/abs/1802.04208 , metin arxiv.org/abs/1801.07736 vb. İle
Alwyn Mathew

Yanıtlar:


9

Bunun doğrudan veri toplama çabalarınızın ötesine geçmesi pek olası değildir.

Mevcut GAN çıkışlarının kalitesi (2017 itibariyle) yeterince yüksek olmayacaktır. Bir GAN tarafından üretilen görüntüler tipik olarak küçüktür ve olağandışı / belirsiz ayrıntılara ve garip bozulmalara sahip olabilir. Bağlı yazıda, bir cümleden sistem tarafından oluşturulan görüntüler konuyu verilen rengin inandırıcı blokları var, ama cümlenin olmadan çoğu olarak tanınabilir değildir ne olacağını size astar herhangi belirli bir konu.

Cümlelerden görüntü üretmekten daha az iddialı bir amaç olan GAN'lar (yukarıdaki eleştirilere rağmen, gerçekten dikkat çekici bir IMO) foto-gerçekçi görüntülere daha yakın üretmelidir. Ancak kapsamları daha az olacaktır ve muhtemelen istediğiniz görüntü türünü içermeyecektir. Ayrıca, tipik olarak çıktı boyutu küçüktür, örneğin 64x64 veya 128x128 * ve orijinal zemin gerçeği fotoğraflarının çok tercih edilebileceği yeterince bozulma ve belirsizlik vardır.

GAN'ın kendisi mevcut eğitim kütüphanesi ile sınırlıdır - eğitim verilerinin kapsamı dışında görüntüler oluşturmaya çalışırsanız iyi olmaz. Araştırma belgesinde gösterilen sonuçlar, elbette, eğitim verileri tarafından sağlanan alana odaklanmaktadır. Ancak bu modele herhangi bir cümle besleyemez ve başka bir yerde faydalı olacak bir sonuç bekleyebilirsiniz.

Sorununuz için uygun bir veri seti üzerinde eğitilmiş bir GAN bulursanız, büyük olasılıkla aynı verileri doğrudan projeniz için kaynaklamaya çalışmaktan daha iyi olursunuz.

Sınırlı zemin gerçeği verileriyle ilgili bir sorunla karşılaşıyorsanız, belki de bir GAN kullanmak için daha iyi bir yaklaşım, VGG-19 veya Inception v5 gibi önceden eğitilmiş bir sınıflandırıcı kullanmak, son birkaç tam bağlı katmanı değiştirmek ve ince verilerinize göre ayarlayın. Python'da Keras kütüphanesini kullanarak bunu yapmanın bir örneği - diğer örnekler "ince ayar CNN görüntü sınıflandırıcısı" gibi aramalarda bulunabilir.


* Bu yanıtı yayınladığımdan beri en son teknolojiye sahip GAN'lar daha iyi hale geldi. Nvidia'daki bir araştırma ekibi 1024x1024 foto-gerçekçi görüntüler oluştururken olağanüstü bir başarı elde etti . Ancak bu, cevabımdaki diğer noktaları değiştirmez. GAN'lar, görüntü sınıflandırması görevleri için güvenilir bir görüntü kaynağı değildir, ancak GAN'ın zaten eğitim gördüğü her şeyin alt görevleri dışında ve sınırlandırıcıları).


3

Şu anda inşa ettiğim bir DNN ile aynı sorunu yaşıyorum. Veri setimi almak ve yeni verileri bir GAN ile sentezlemek harika bir fikir gibi görünüyor. Ancak GAN'ın kendisi, yalnızca eğitim setinde öğrenilenle aynı görüntü varyansı ve standart sapmalara sahip görüntüler vermeyi öğrenecektir. Böylece, yeni oluşturulan verileriniz aynı örnek dağılımının daha fazla permütasyonunu temsil edecektir. Bu, NN'nizin aynı dağıtımda daha iyi antrenman yapmasına yardımcı olacaktır, bu nedenle daha fazla aşırı eğitime neden olabilir.


3

Sadece teorik bir bakış açısıyla bu mümkün olamaz.

Belirli bir eğitim veri kümesi, belirli bir alanın yapısı hakkında belirli miktarda bilgiyi temsil eder. Bu veri kümesinde bir GAN eğitirseniz, yalnızca bu veri kümesinin temsil ettiği bilgilerden öğrenilir. GAN tarafından sentezlenen veriler hiçbir zaman asıl verilerden daha geniş bir alandan olamaz, basit bir nedenden dolayı: Bu bilgilerin nereden gelmesi gerekir? Orijinal veri kümesinde değilse, GAN'ın sentezlenmiş verilerinde de olamaz.

Bir sinir ağını bir veri kümesinde yakınsama için eğitirseniz, bu sinir ağı veri kümesinin içerdiği yapıyı öğrenir. Bir GAN tarafından sentezlenen yapay eğitim verileri yeni bilgi eklemez. Bu fikir çok açık olmalı.


2

Aslında, onu geliştirmek için GAN'larla küçük bir Veri Kümesini genişletmek mümkündür ve ayrıca https://arxiv.org/pdf/1803.01229.pdf adresinden okuyabileceğiniz gibi Sınıflandırma Ağlarının Performansını da artıracaktır . GAN'lar, örneğin orijinal tarih kümesinde yer almayan ancak yine de geçerli olan ara şekilleri öğrenebilir. Böylece sentetik görüntüler veri kümesi boyutunu iyileştirebilir ve CNN sınıflandırma doğruluğunu artırabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.