Bildiğim kadarıyla, hem oto-kodlayıcılar hem de t-SNE, doğrusal olmayan boyutsallık azalması için kullanılır. Aralarındaki farklar nelerdir ve neden birini diğerine karşı kullanmalıyım?
Bildiğim kadarıyla, hem oto-kodlayıcılar hem de t-SNE, doğrusal olmayan boyutsallık azalması için kullanılır. Aralarındaki farklar nelerdir ve neden birini diğerine karşı kullanmalıyım?
Yanıtlar:
Her ikisi de verilerinize daha düşük bir boyutsal yerleştirme bulmaya çalışır. Bununla birlikte, farklı minimizasyon problemleri vardır. Daha spesifik olarak, bir otomatik enkoder yeniden yapılandırma hatasını en aza indirmeye çalışırken, t-SNE daha düşük boyutlu bir alan bulmaya çalışır ve aynı zamanda mahalle mesafelerini korumaya çalışır. Bu niteliğin bir sonucu olarak, grafikler ve görselleştirmeler için genellikle t-SNE tercih edilir.
[Otomatik kodlayıcılar] öncelikle gizli alandaki verilerin varyansını en üst düzeye çıkarmaya odaklanır, bunun sonucunda otomatik kodlayıcılar, gizli alandaki verilerin yerel yapısını, manifold öğrenenlerden daha az başarılı kılar ...
Laurens van der Maaten "Yerel Yapıyı Koruyarak Parametrik Gömmeyi Öğrenmek" ten ( https://lvdmaaten.github.io/publications/papers/AISTATS_2009.pdf )
Otomatik enkoder ve t-SNE, [1] 'de açıklandığı gibi yüksek boyutlu verilerde daha iyi görüntüleme için birlikte kullanılabilir:
Özellikle 2D görselleştirme için, t-SNE muhtemelen en iyi algoritmadır, ancak tipik olarak nispeten düşük boyutlu veriler gerektirir. Bu nedenle, yüksek boyutlu verilerdeki benzerlik ilişkilerini görselleştirmek için iyi bir strateji, verilerinizi düşük boyutlu bir alana (örneğin 32 boyutlu) sıkıştırmak için bir otomatik kodlayıcı kullanarak başlamak, ardından sıkıştırılmış verileri bir 2B düzleme eşlemek için t-SNE kullanmaktır. .
[1] https://blog.keras.io/building-autoencoders-in-keras.html
Otomatik kodlayıcı, veri hızı ise verilerin önceki kinetik enerjisini koruduğu düşünülebilen 2 normluk bir anlamda önceki verileri korumak üzere tasarlanmıştır.
T-SNE, simetrik olmayan KL ıraksamasını kullanırken, t-SNE'nin yerel yapıya daha fazla odaklanmasına neden olurken, otomatik kodlayıcı genel anlamda L2 hatasını küçük tutar, bu da küresel anlamda.