«high-dimensional» etiketlenmiş sorular

Veriler için çok sayıda özellik veya boyut (değişken) ile ilgilidir. (Çok sayıda veri noktası için, [büyük-veri] etiketini kullanın; sorun, veriden daha fazla sayıda değişkense, [underdetermined] etiketini kullanın.)

2
Örneklemeden yüksek boyutlu çıkarım problemlerinde belirsizlik tahmini?
Gradyan tabanlı optimizasyon ve genetik algoritmanın bir kombinasyonunu kullanarak log-posterior'un küresel maksimumunu bularak MAP tahminini sağlam bir şekilde gerçekleştirebileceğimiz yüksek boyutlu bir çıkarım problemi (yaklaşık 2000 model parametreleri) üzerinde çalışıyorum. MAP tahminini bulmanın yanı sıra, model parametreleri üzerindeki belirsizlikleri biraz tahmin edebilmek istiyorum. Log-posteriorun gradyanını parametrelere göre etkili bir şekilde …

1
Çocuklar bir GWAS veri setinin PCA projeksiyonunda ebeveynlerini bir araya getirmeyi nasıl başarırlar?
10.000 boyutlu bir alanda 20 rastgele nokta alın. N-( 0 , 1 )N-(0,1)\mathcal N(0,1). Onları 10 çifte ("çiftler") ayırın ve veri kümesine her çiftin ("bir çocuk") ortalamasını ekleyin. Sonra elde edilen 30 noktada PCA yapın ve PC1'e PC2'yi çizin. Dikkat çekici bir şey olur: her "aile" birbirine yakın noktalardan oluşan …

1
Yüksek boyutlu, ilişkili veriler ve keşfedilen en iyi özellikler / ortak değişkenler; çoklu hipotez testi?
Ben yaklaşık 5.000 ile ilişkili özellikleri / ortak değişkenleri ve ikili bir yanıt ile bir veri kümesi var. Veriler bana verildi, ben toplamadım. Modeller oluşturmak için Kement ve gradyan güçlendirme kullanıyorum. Yinelenen, iç içe çapraz doğrulamayı kullanıyorum. Lasso'nun en büyük (mutlak) 40 katsayısını ve degrade artırılmış ağaçlardaki en önemli 40 …

3
PCA her ikisi de n, p büyük olduğunda çok yavaş: Alternatifler?
Sorun Ayarı 2D olarak görselleştirmeye çalıştığım yüksek boyutlu (4096) veri noktalarına (görüntüler) sahibim. Bu amaçla, Karpathy'nin aşağıdaki örnek koduna benzer bir şekilde t-sne kullanıyorum . Scikit-öğrenme dokümantasyon ilk verilerin boyutunu düşürmek için PCA kullanılmasını önerir: Özellik sayısının çok yüksek olması durumunda boyut sayısını makul bir miktara (örneğin 50) düşürmek için …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.