Boyut küçültmenin neden önemli olduğunu anlamıyorum. Bazı verileri almanın ve boyutlarını azaltmanın faydası nedir?
Boyut küçültmenin neden önemli olduğunu anlamıyorum. Bazı verileri almanın ve boyutlarını azaltmanın faydası nedir?
Yanıtlar:
Tekil değer ayrışması (SVD), verilerin boyutsallığını azaltmakla aynı şey değildir. Bir matrisi, buraya girmeyeceğim birçok harika özelliğe sahip diğer matrislere ayrıştırma yöntemidir. SVD hakkında daha fazla bilgi için Wikipedia sayfasına bakın .
Verilerinizin boyutsallığını azaltmak bazen çok yararlı olabilir. Gözlemlerden çok daha fazla değişkeniniz olabilir; bu genomik çalışmada nadir değildir. Çok az ilişkili birkaç değişkenimiz olabilir, örneğin az sayıda altta yatan faktörden büyük oranda etkilendiklerinde ve altta yatan faktörlere biraz yaklaşmak istiyoruz. Temel bileşen analizi, çok boyutlu ölçekleme ve kanonik değişken analizi gibi boyut azaltıcı teknikler, gözlemler ve / veya başka türlü elde edemeyeceğimiz değişkenler arasındaki ilişkiler hakkında bize fikir verir.
Somut bir örnek: Birkaç yıl önce üzerinde 100'den fazla soru olan bir çalışan memnuniyeti anketini analiz ediyordum. Eh, hiçbir yönetici, özetlenmiş bile olsa 100'den fazla soruya cevap bulamayacak ve hepsinin ne anlama geldiğini tahmin etmekten daha fazlasını yapamayacak, çünkü cevapların nasıl ilişkili olduğunu ve onları neyin yönlendirdiğini kim söyleyebilir? ? 10.000'den fazla gözlem yaptığım veriler üzerinde bir faktör analizi yaptım ve tümüyle özetleyecek olan yöneticiye özgü puanlar (her faktör için bir tane) geliştirmek için kullanılabilecek çok açık ve kolayca yorumlanabilen beş faktör buldum. 100+ soru anketi. Sonuçları raporlamanın önceki yöntemi olan Excel elektronik tablo dökümünden çok daha iyi bir çözüm!
Sorunun önem derecesine ilişkin olarak, bir veri kümesi için boyut azalmasının faydaları şunlar olabilir:
Bunun dışında, PCA'nın ötesinde, SVD'ler Sinyal İşleme, NLP ve daha birçok uygulamada
Bir göz atın bu cevabın benim. Tekil değer ayrışması, çok faydalı ve çok güçlü bir veri analizi tekniği olan temel bileşenler analizinin önemli bir bileşenidir .
Genellikle yüz tanıma algoritmalarında kullanılır ve günlük işimde bir hedge fon analisti olarak sık sık kullanıyorum.