«multidimensional-scaling» etiketlenmiş sorular

Düşük boyutlu bir uzayda (genellikle Öklid) nesneler arasında gözlemlenen veya hesaplanan (dis) benzerlikleri mesafelere dönüştüren teknik. Böylece veriler için boyutlar oluşturur; nesneler bu boyutlarda çizilebilir ve kavramsallaştırılabilir


3
Model doğrulamasından önce veya içinde özellik normalizasyonu yapılıyor mu?
Makine Öğreniminde yaygın olarak kullanılan iyi bir uygulama, yordayıcı değişkenlerinin normalleştirilmesi veya veri standardizasyonu yapmaktır, işte bu, ortalamayı veren veriyi ortalamak ve varyansa (veya standart sapma ile) bölerek normalleştirmektir. Kendini kapsama ve anlamam için bunu iki ana şeyi başarmak için yapıyoruz: Sayısal stabilite amacıyla ekstra küçük model ağırlıklarından kaçının. Örneğin, …

7
Yapay sinir ağlarında veri normalleşmesi ve standardizasyon
Sinir ağlarını (YSA) kullanarak karmaşık bir sistemin sonucunu tahmin etmeye çalışıyorum. Sonuç (bağımlı) değerler 0 ile 10,000 arasındadır. Farklı giriş değişkenlerinin farklı aralıkları vardır. Tüm değişkenler kabaca normal dağılımlara sahiptir. Antrenmandan önce verileri ölçeklendirmek için farklı seçenekler düşünüyorum. Bir seçenek, her değişkenin ortalama ve standart sapma değerlerini bağımsız olarak kullanarak …

3
LASSO için gösterge / binary / kukla tahmin edicilerin ölülüp kurtarılmayacağı
LASSO (ve diğer model seçim prosedürleri) için tahmincileri yeniden düzenlemek çok önemlidir. Genel öneri ı takip sürekli değişkenler için bir 0 ortalama, 1 standart sapma normalleşmesini kullanmak için basitçe. Ama aptallarla ne ilgisi var? Örneğin , aynı (mükemmel) yaz okulundan bazı uygulamalı örnekler , muhtemelen aptallarla karşılaştırılabilir olması için sürekli …

1
MDS'ye karşı t-SNE
Son zamanlarda t-SNE ( t-Dağıtılmış Stokastik Komşu Yerleşimi ) ile ilgili bazı soruları okudum ve ayrıca MDS ( Çok Boyutlu Ölçeklendirme ) ile ilgili bazı soruları da ziyaret ettim . Genellikle benzer şekilde kullanılırlar, bu yüzden burada her ikisinde de (veya PCA ile karşılaştırıldığında ) birçok soru olduğunu görünce bu …

5
Veri akışı için t-SNE'nin herhangi bir sürümü var mı?
Benim anlayış , t-SNE ve Barnes-Hut yaklaşım tüm veri noktaları tüm kuvvet etkileşimleri aynı anda hesaplanabilir ve her nokta 2d ayarlanabilir (veya boyutsal alt) ilk böylece gerekli olmasıdır. Veri akışı ile etkin bir şekilde başa çıkabilen t-sne'nin herhangi bir sürümü var mı? Dolayısıyla, gözlemlerim birer birer geliyorsa, yeni gözlemi yerleştirmek …

3
MDS'nin modern istatistikteki rolü nedir?
Son zamanlarda çok boyutlu ölçeklendirme ile karşılaştım. Bu aracı ve modern istatistikteki rolünü daha iyi anlamaya çalışıyorum. İşte birkaç yol gösterici soru: Hangi sorulara cevap veriyor? Hangi araştırmacılar genellikle onu kullanmakla ilgileniyor? Benzer işlevleri yerine getiren başka istatistiksel teknikler var mı? Etrafında hangi teori geliştirildi? "MDS" ile "SSA" arasında nasıl …

1
RandomForest - MDS çizim yorumu
RandomForest'i 6 hayvan davranışını (örneğin Ayakta, Yürüme, Yüzme vb.) 8 değişkene (farklı vücut duruşları ve hareket) göre sınıflandırmak için kullandım. RandomForest paketindeki MDSplot bana bu çıktıyı verir ve sonucu yorumlamada sorun yaşıyorum. Aynı veriler üzerinde bir PCA yaptım ve zaten PC1 ve PC2'deki tüm sınıflar arasında güzel bir ayrım yaptım, …

4
Sadece mesafe matrisi ile PCA gerçekleştirmek
Sadece çift mesafelere sahip olduğum büyük bir veri kümesini kümelemek istiyorum. Bir k-medoid algoritması uyguladım, ancak çalışması çok uzun sürüyor, bu yüzden PCA'yı uygulayarak sorunumun boyutunu azaltarak başlamak istiyorum. Ancak, bu yöntemi gerçekleştirmenin tek yolu benim durumumda olmayan kovaryans matrisini kullanmaktır. PCA'yı sadece çift mesafeleri bilerek uygulamak için bir yol …


2
Çok boyutlu verileri (LSI) 2B olarak görüntüleme
Belgeler arasındaki benzerlikleri bulmak için gizli anlamsal indeksleme kullanıyorum ( teşekkürler, JMS! ) Boyut küçültmeden sonra, belgeleri çok iyi çalışan kümeler halinde gruplamak için k-ortalama kümelemeyi denedim. Ama biraz daha ileri gitmek ve belgeleri herhangi bir iki düğüm arasındaki mesafenin benzerlikleriyle ters orantılı olduğu bir düğüm kümesi olarak görselleştirmek istiyorum …

2
Ölçeklenebilir boyut küçültme
Sabit özelliklerin sayısı göz önüne alındığında, Barnes-Hut t-SNE'nin karmaşıklığıO ( n günlüğün )O(nlog⁡n)O(n\log n), rastgele projeksiyonlar ve PCA, çok büyük veri setleri için onları "uygun fiyatlı" yapan karmaşıklığına sahiptir .O ( n )O(n)O(n) Öte yandan, güvenerek yöntemleri boyutlu ölçekleme bir olması karmaşıklığı.O (n2)O(n2)O(n^2) Karmaşıklığı daha düşük olan başka boyut küçültme …

1
ReLU nöronları için Giriş Normalizasyonu
Göre LeCun ve arkadaşları (1998) tarafından "Etkin Backprop" bunların ikinci türev en aralığında yaklaşık 0 ve yalan merkezli şekilde tüm girdilerin normalleştirmek için iyi bir uygulamadır. Örneğin, "Tanh" işlevi için [-0.5,0.5] kullanırdık. Bu, Hessian daha istikrarlı hale geldiğinden geri yayılmanın ilerlemesine yardımcı olmak içindir. Bununla birlikte, max (0, x) olan …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.