Her biri 200 boyutlu ( doc2vec
) olan yaklaşık 1 milyon vektörde boyutsal küçültme yapmak istiyorum . Bunun için modülden TSNE
uygulama kullanıyorum sklearn.manifold
ve asıl sorun zaman karmaşıklığı. Bununla birlikte method = barnes_hut
, hesaplama hızı hala düşüktür. Bir süre Bellek yetersiz bile.
130G RAM ile 48 çekirdekli bir işlemcide çalıştırıyorum. Bunu paralel olarak çalıştırmak veya süreci hızlandırmak için bol kaynak kullanmak için bir yöntem var mı?