Oto-kodlayıcılar ve t-SNE arasındaki farklar nelerdir?


Yanıtlar:


8

Her ikisi de verilerinize daha düşük bir boyutsal yerleştirme bulmaya çalışır. Bununla birlikte, farklı minimizasyon problemleri vardır. Daha spesifik olarak, bir otomatik enkoder yeniden yapılandırma hatasını en aza indirmeye çalışırken, t-SNE daha düşük boyutlu bir alan bulmaya çalışır ve aynı zamanda mahalle mesafelerini korumaya çalışır. Bu niteliğin bir sonucu olarak, grafikler ve görselleştirmeler için genellikle t-SNE tercih edilir.


Peki bu anlamda, alt boyut 3D'den daha fazla olduğunda otomatik enkoderin daha düşük boyut bulmak daha iyi olduğu anlamına mı geliyor? (Çünkü alt boyut büyükse, t-SNE o kadar iyi çalışmayabilir?)
RockTheStar

2
Görevinize bağlı olarak birçok otomatik kodlayıcı türü (seyrek, varyasyonel, yığınlanmış, evrişimli vb.) Vardır. Rekonstrüksiyon hatasına dayanan düşük boyutlu düğünleri keşfetmede çok verimli olabilirler. Bu nedenle, göreviniz optimum bir düşük boyutlu alan (hatta 2D) bulmaksa, göreviniz için doğru otomatik kodlayıcıyı seçmenizi öneririm. Görselleştirmeler yapmanız gerekiyorsa, t-SNE muhtemelen seçiminiz olacaktır. komşu mesafelerin korunması olarak, daha iyi görselleştirme ile sonuçlanabilir.
Yannis Assael

2

[Otomatik kodlayıcılar] öncelikle gizli alandaki verilerin varyansını en üst düzeye çıkarmaya odaklanır, bunun sonucunda otomatik kodlayıcılar, gizli alandaki verilerin yerel yapısını, manifold öğrenenlerden daha az başarılı kılar ...

Laurens van der Maaten "Yerel Yapıyı Koruyarak Parametrik Gömmeyi Öğrenmek" ten ( https://lvdmaaten.github.io/publications/papers/AISTATS_2009.pdf )


Bu "t-SNE kağıdı" değildir. Standart t-SNE parametrik değildir.
amip

1
Bu konuda yorumunuz için @amoeba teşekkürler. Gönderiyi düzenledim.
Kullanıcı128525

1

Otomatik enkoder ve t-SNE, [1] 'de açıklandığı gibi yüksek boyutlu verilerde daha iyi görüntüleme için birlikte kullanılabilir:

Özellikle 2D görselleştirme için, t-SNE muhtemelen en iyi algoritmadır, ancak tipik olarak nispeten düşük boyutlu veriler gerektirir. Bu nedenle, yüksek boyutlu verilerdeki benzerlik ilişkilerini görselleştirmek için iyi bir strateji, verilerinizi düşük boyutlu bir alana (örneğin 32 boyutlu) sıkıştırmak için bir otomatik kodlayıcı kullanarak başlamak, ardından sıkıştırılmış verileri bir 2B düzleme eşlemek için t-SNE kullanmaktır. .


[1] https://blog.keras.io/building-autoencoders-in-keras.html


0

Otomatik kodlayıcı, veri hızı ise verilerin önceki kinetik enerjisini koruduğu düşünülebilen 2 normluk bir anlamda önceki verileri korumak üzere tasarlanmıştır.

T-SNE, simetrik olmayan KL ıraksamasını kullanırken, t-SNE'nin yerel yapıya daha fazla odaklanmasına neden olurken, otomatik kodlayıcı genel anlamda L2 hatasını küçük tutar, bu da küresel anlamda.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.