VAE, büyük veri kümelerinde varyasyonel EM (veya genel olarak varyasyon çıkarımı) yapmak için ölçeklenebilir bir yol olarak önerilen bir çerçevedir. AE benzeri bir yapıya sahip olmasına rağmen, çok daha büyük bir amaca hizmet eder.
Bunu söyledikten sonra, elbette gizli temsilleri öğrenmek için VAE'leri kullanabilirsiniz. VAE'lerin çözülmüş faktörlerle temsiller verdiği bilinmektedir [1] Bu, latent değişkenler üzerindeki izotropik Gauss önceliklerinden dolayı olur. Onları Gaussyalılar olarak modellemek, temsildeki her boyutun kendilerini diğer faktörlerden mümkün olduğunca uzağa itmesine izin verir. Ayrıca, [1] öncekinin etkisini kontrol eden bir düzenleme katsayısı ekledi.
İzotropik Gausslar çoğu vaka için yeterli olsa da, belirli vakalar için, öncelikleri farklı şekilde modellemek isteyebilirsiniz. Örneğin, diziler söz konusu olduğunda, öncelikleri ardışık modeller olarak tanımlamak isteyebilirsiniz [2].
Soruna geri dönersek, görüldüğü gibi, gizli dağılımımızı nasıl modellemek istediğimiz üzerinde önemli bir kontrol sağlıyor. Bu tür bir kontrol olağan AE çerçevesinde mevcut değildir. Bu aslında Bayes modellerinin gücüdür, VAE'ler basitçe onu büyük ölçekli veri kümeleri için daha pratik ve uygulanabilir kılmaktadır. Sonuç olarak, gizli temsilleriniz ve neyi temsil etmelerini istediğiniz üzerinde tam kontrol istiyorsanız, VAE'yi seçin. Bazen, hassas modelleme [2] 'deki gibi daha iyi temsilleri yakalayabilir. Ancak, AE yaptığınız iş için yeterliyse, sadece AE ile gidin, yeterince basit ve karmaşık değildir. Sonuçta, AE'ler ile sadece doğrusal olmayan PCA yapıyoruz.
[1] Denetimsiz Derin Öğrenme ile Erken Görsel Kavram Öğrenme, 2016
Irina Higgins, Loic Matthey, Xavier Glorot, Arka Pal, Benigno Uria, Charles Blundell, Shakir Mohamed, Alexander Lerchner
https://arxiv.org/abs/1606.05579
[2] Sıralı Veriler için Tekrarlayan Gizli Değişken Model, 2015
Junyoung Chung, Kyle Kastner, Laurent Dinh, Kratarth Goel, Aaron Courville, Yoshua Bengio
https://arxiv.org/abs/1506.02216