Evet, GAN'lar metin için kullanılabilir. Bununla birlikte, GAN'ların nasıl çalıştığı ve metnin normal olarak sinir ağları tarafından nasıl oluşturulduğu kombinasyonunda bir sorun vardır:
- GAN'lar, Jeneratör ve Ayırıcı bileşimi yoluyla degradeleri yayarak çalışır.
- Metin normal olarak belirteç alanı üzerinde son bir softmax katmana sahip olarak üretilir, yani ağın çıktısı normalde her belirteci (yani ayrı bir stokastik birim) oluşturma olasılıklarıdır.
Bu 2 şey kendi başlarına birlikte iyi çalışmaz, çünkü degradeleri ayrık stokastik birimler aracılığıyla yayamazsınız. Bununla başa çıkmak için 2 ana yaklaşım vardır: REINFORCE algoritması ve Gumbel-Softmax yeniden parametrelendirmesi ( Beton dağıtımı olarak da bilinir ). REINFORCE'un yüksek varyansa sahip olduğu bilindiğinden, iyi degrade tahminleri almak için büyük miktarda veriye ihtiyacınız vardır.
Metinsel GAN'lar için REINFORCE örneği olarak SeqGAN makalesine göz atabilirsiniz . Gumbel-Softmax'a bir örnek bu makaleyi kontrol edebilirsiniz .
Tamamen farklı bir başka seçenek, jeneratörün çıkışı olarak ayrı bir stokastik birime sahip olmamaktır (örn. Gömülü alanda belirleyici olarak belirteçler üretmek), böylece aralarında orijinal geri yayılım problemini ortadan kaldırır.