«tsne» etiketlenmiş sorular

T-dağıtılmış stokastik komşu gömme (t-SNE), 2008 yılında van der Maaten ve Hinton tarafından tanıtılan doğrusal olmayan bir boyutluluk azaltma algoritmasıdır.

2
Boyutları azaltmak için t-SNE için parametreler nasıl belirlenir?
Kelime düğünlerinde çok yeniyim. Öğrenmenin ardından belgelerin nasıl göründüğünü görselleştirmek istiyorum. T-SNE'nin bunu yapmak için bir yaklaşım olduğunu okudum. Gömme boyutu olarak 250 boyutta 100K dokümanım var. Ayrıca birkaç paket mevcuttur. Bununla birlikte, t-SNE için, daha fazla öğrenmeye devam etmem gereken kaç yineleme veya alfa değeri veya esneklik değeri bilmiyorum. …

1
PCA ile sadece büyük çift mesafeleri koruyarak ne kastedilmektedir?
Şu anda t-SNE görselleştirme tekniğini okuyorum ve yüksek boyutlu verileri görselleştirmek için temel bileşen analizini (PCA) kullanmanın dezavantajlarından birinin, noktalar arasındaki sadece büyük çift mesafeleri koruduğu belirtildi. Yüksek boyutlu uzayda birbirinden ayrı olan anlam noktaları, düşük boyutlu altuzayda da çok farklı görünecektir, ancak diğer tüm çift mesafeler vidalanacaktır. Birisi bunun …

1
Karışık sürekli ve ikili değişkenli t-SNE
Şu anda t-SNE kullanarak yüksek boyutlu verilerin görselleştirilmesini araştırıyorum. Karışık ikili ve sürekli değişkenler ile bazı veriler var ve veri ikili verileri çok kolayca küme gibi görünüyor. Tabii ki bu ölçeklenmiş (0 ile 1 arasında) veriler için beklenir: Öklid mesafesi her zaman ikili değişkenler arasında en büyük / en küçük …

3
PCA her ikisi de n, p büyük olduğunda çok yavaş: Alternatifler?
Sorun Ayarı 2D olarak görselleştirmeye çalıştığım yüksek boyutlu (4096) veri noktalarına (görüntüler) sahibim. Bu amaçla, Karpathy'nin aşağıdaki örnek koduna benzer bir şekilde t-sne kullanıyorum . Scikit-öğrenme dokümantasyon ilk verilerin boyutunu düşürmek için PCA kullanılmasını önerir: Özellik sayısının çok yüksek olması durumunda boyut sayısını makul bir miktara (örneğin 50) düşürmek için …

2
Ölçeklenebilir boyut küçültme
Sabit özelliklerin sayısı göz önüne alındığında, Barnes-Hut t-SNE'nin karmaşıklığıO ( n günlüğün )O(nlog⁡n)O(n\log n), rastgele projeksiyonlar ve PCA, çok büyük veri setleri için onları "uygun fiyatlı" yapan karmaşıklığına sahiptir .O ( n )O(n)O(n) Öte yandan, güvenerek yöntemleri boyutlu ölçekleme bir olması karmaşıklığı.O (n2)O(n2)O(n^2) Karmaşıklığı daha düşük olan başka boyut küçültme …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.