Orijinal 99 (100-1) değişkeninizin bir alt kümesini seçmezsiniz.
Temel bileşenlerin her biri, 99 öngörücü değişkenin (x-değişken, IV, ...) doğrusal birleşimleridir. İlk 40 temel bileşeni kullanırsanız, bunların her biri 99 orijinal belirteç değişkeninin bir işlevidir. (En azından sıradan PCA ile - daha az değişkene dayanan bileşenler verecek Zou, Hastie ve Tibshirani SPCA gibi seyrek / düzenli sürümler vardır .)
Basitlik açısından eşit derecede değişken olduğunu varsaydığımız, pozitif olarak ilişkili iki değişkenin basit durumunu düşünün. Daha sonra birinci temel bileşen, her iki değişkenin toplamının (kesirli) bir katı ve ikincisi, iki değişkenin farkının (kesirli) bir katı olacaktır; eğer ikisi eşit derecede değişken değilse, ilk temel bileşen daha değişken olanı daha ağır bir şekilde ağırlıklandıracaktır, ancak yine de her ikisini de içerecektir.
Böylece, orijinal değişkenlerin her birine karşılık gelen ağırlıkları uygulayarak 40 temel bileşeninizi hesapladığınız 99 x değişkeninizle başlıyorsunuz. [Tartışmamda NB varsayalımy ve Xzaten ortalanmış.]
Daha sonra 40 yeni değişkeni, tıpkı herhangi bir çoklu regresyon probleminde olduğu gibi, kendi başlarına tahminci gibi kullanırsınız. (Uygulamada, tahminleri almanın daha etkili yolları var, ancak hesaplama yönlerini bir kenara bırakalım ve sadece temel bir fikirle başa çıkalım)
İkinci sorunuzla ilgili olarak, "PCA'nın tersine çevrilmesi" ile ne demek istediğiniz açık değildir.
Bilgisayarlarınız orijinal değişkenlerin doğrusal kombinasyonlarıdır. Diyelim ki orijinal varyantlarınızXve sen hesapla Z= XW (nerede X dır-dir n × 99 ve W bu 99 × 40 için ana bileşen ağırlıklarını içeren matris 40 kullandığınız bileşenler) y^= Zβ^PC regresyon yoluyla.
Sonra yazabilirsin y^= Zβ^PC= XWβ^PC= Xβ^* söyle (nerede β^*= Wβ^PC, tabii ki), böylece orijinal öngörücülerin bir işlevi olarak yazabilirsiniz; 'Tersine çevirmek' ile kastettiğin bu mu bilmiyorum, ama bu arasındaki orijinal ilişkiye bakmak için anlamlı bir yoly ve X. Elbette orijinal X'lerde bir gerileme tahmin ederek elde ettiğiniz katsayılarla aynı değildir - PCA yaparak düzenlenir; Orijinal X'lerinizin her biri için bu şekilde katsayılar elde etseniz bile, yalnızca taktığınız bileşen sayısının df'sine sahipler.
Ayrıca ana bileşen regresyonu hakkında Wikipedia'ya bakın .