Neden düşük rütbeli yaklaşımlarla uğraşasınız ki?


20

N satırı ve m sütunu olan bir matrisiniz varsa , verilen matrisin düşük dereceli bir yaklaşımını hesaplamak için SVD'yi veya diğer yöntemleri kullanabilirsiniz .

Bununla birlikte, düşük rütbeli yaklaşımda hala n satır ve m sütun olacaktır. Aynı sayıda özelliğe sahip olmanız koşuluyla, düşük seviyeli yaklaşımlar makine öğrenimi ve doğal dil işleme için nasıl yararlı olabilir?


2
Genellikle seyrek temsillere sahiptirler - düşük rütbeli bir yaklaşım için numaralarını saklamanız gerekmez . Örneğin, 1. sıra yaklaşımı sayıları gerektirir . n + mmnn+m
olasılık

Yanıtlar:


16

Düşük seviye yaklaştırma arasında gibi bir matris karekökü ayrılacak olabilir ve öz ayrışma olan böylece ile temsil edilebilir özellikler sayısını azaltarak, olarak seviye-r yaklaşılmasına dayanan . Alt simge X,G=urλ 1X^XX,UλUTGX=GG, TrG,=Urλr12XUλUTG,X^=G,G,Tr "Eksen" terimi yaklaşıklamada kullanılan öz vektörlerin ve öz değerlerin sayısını temsil eder. Dolayısıyla, verileri temsil eden özelliklerin sayısını azaltır. Bazı örneklerde, düşük sıralı yaklaşımlar, ortogonallik, olumsuzluk (negatif olmayan matris çarpanlarına ayırma) vb.


5

Düşük dereceli yaklaşım noktası, yalnızca boyut küçültme gerçekleştirmek için gerekli değildir.

Fikir, etki alanı bilgisine dayanarak, matrisin verilerinin / girişlerinin bir şekilde matrisi düşük seviyeye çıkaracağıdır. Ancak bu, girişlerin gürültü, yolsuzluk, eksik değerler vb.

Düşük dereceli yaklaşım, bu nedenle "orijinal" (gürültü vb. İle karıştırılmadan önce "ideal" matrisi geri kazanmanın bir yoludur) düşük dereceli matrisi, yani, en tutarlı olan matrisi bulmak (gözlemlenen girişler açısından) akım matrisi ile düşük derecelidir ve böylece ideal matrise bir yaklaşım olarak kullanılabilir. Bu matrisi kurtardıktan sonra, gürültülü sürümün yerine kullanabilir ve umarım daha iyi sonuçlar elde edebiliriz.


4

Şimdiye kadar bahsedilmeyen iki neden daha:

  1. Doğrusallığı azaltma. Bu tekniklerin çoğunun, takip eden işlemler için yararlı olabilecek olan doğrusallığı ortadan kaldırdığına inanıyorum.

  2. Hayal gücümüz düşük rütbeli, bu nedenle düşük rütbeli ilişkileri keşfetmek için yararlı olabilir.



1

"Modern çok değişkenli istatistiksel tekniklere (Izenman)" göre azalan rütbe regresyonu, PCA, faktör analizi, kanonik değişken ve korelasyon analizi, LDA ve yazışma analizi gibi özel durumlar gibi çeşitli ilginç yöntemleri kapsar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.