Bir makine öğrenimi dersinde, PCA'nın ( Temel Bileşen Analizi ) yaygın bir kullanımının diğer makine öğrenimi algoritmalarını hızlandırmak olduğunu öğrendim . Örneğin, bir lojistik regresyon modeli geliştirdiğinizi düşünün. İ için 1'den n'ye kadar bir eğitim setiniz ve x vektörünüzün boyutu çok büyükse (diyelim bir boyutlar), PCA'yı kullanarak daha küçük bir boyut elde edelim (diyelim ki k boyutları) özellik vektörü z. Daha sonra lojistik regresyon modelinizi 1'den n'ye kadar i için eğitim setinde eğitebilirsiniz . Özellik vektörünüzün boyutları daha az olduğundan bu modeli eğitmek daha hızlı olacaktır.( z ( i ) , y ( i ) )
Ancak, özelliklerinizin k'sını rasgele seçip kalanını ortadan kaldırarak neden özellik vektörünün boyutunu k boyutlarına küçültemeyeceğinizi anlamıyorum.
Z vektörleri, bir özellik vektörlerinizin doğrusal kombinasyonlarıdır. Z vektörleri k-boyutlu bir yüzeyle sınırlı olduğu için, ak elimine edilmiş özellik değerlerini k kalan özellik değerlerinin doğrusal bir fonksiyonu olarak yazabilirsiniz ve böylece tüm z'ler k özelliklerinizin doğrusal kombinasyonları ile oluşturulabilir. Öyleyse, elenen özelliklere sahip bir eğitim seti üzerinde eğitilmiş bir model, boyutu PCA tarafından azaltılmış bir eğitim seti üzerinde eğitilmiş bir modelle aynı güce sahip olmamalı mı? Sadece modelin türüne ve bir çeşit doğrusal kombinasyona dayanıp dayanmadığına mı bağlı?