PCA'nın daima koordinat eksenlerini döndürdüğü göz önüne alındığında, "döndürülmüş" ve "döndürülmemiş" ana bileşenler nelerdir?


13

Anladığım kadarıyla, ana bileşenler, maksimum varyans yönleriyle hizalamak için koordinat eksenlerini döndürerek elde edilir.

Yine de, "döndürülmemiş ana bileşenler" hakkında okumaya devam ediyorum ve istatistik yazılımım (SAS) bana döndürülmemiş olanların yanı sıra varimax döndürülmüş ana bileşenleri de veriyor. Burada kafam karıştı: temel bileşenleri hesapladığımızda, eksenler zaten döndürülmüş durumda; Peki neden başka bir rotasyona ihtiyaç var? Peki "döndürülmemiş ana bileşen" ne anlama geliyor?


1
Sadece yazılımın nasıl çalıştığıyla ilgili sorular burada konu dışıdır, ancak burada gömülü gerçek bir istatistiksel sorunuz olabilir. Temeldeki istatistiksel sorunu açıklığa kavuşturmak için sorunuzu düzenlemek isteyebilirsiniz. İlgili istatistiksel kavramları anladığınızda, yazılıma özgü öğelerin kendiliğinden belirgindir veya en azından dokümantasyondan kolay olduğunu görebilirsiniz.
gung - Monica'yı eski

1
@gung - Sorum yazılımla ilgili değil. Belki yanlış yerleştirmiş olabilirim. Bilmek istediğim tek şey, anlayışım gereği, temel bileşenleri yalnızca eksenleri maksimum varyans çizgisinde döndürdüğümüzde elde etmemiz. O zaman roroted ana bileşen nedir, PCA hakkında açıklayan çeşitli sayfalarda buldum bir terim. Sorumun hala belirsiz olup olmadığını lütfen bana bildirin.
Srewashi Lahiri

Kesinlikle SAS ile ilgili gibi görünüyor . Değilse, SAS referanslarını kaldırmak ve sorunuzu yazılımdan bağımsız olarak yeniden açıklamak için Q'nuzu düzenlerim. Bu konuyu okumak da ilginizi çekebilir .
gung - Monica'yı eski

SAS'tan bahsettim çünkü o yazılımdaki analizi yapıyordum. Kelimeyi indirseniz bile, sorunun düzenlenmiş versiyonuna bir açıklama getirebilirsiniz. Ayrıca iplik geçirdim. Yanılıyorsam lütfen beni düzeltin. Ana bileşenleri hesapladığımızda, eksenlerin zaten döndürülmüş olduğu anlamına gelir. Bu yüzden başka bir varimax gösterimi gerekli değildir. Öyle mi? Bu kısım hakkında gerçekten kafam karıştı. Şimdiden çok teşekkürler
Srewashi Lahiri

2
Srewashi, yorumdaki açıklamalarınıza dayanarak sorunuzu önemli ölçüde yeniden yazma özgürlüğünü aldım. Bence bu iyi bir soru, +1. Lütfen düzenlemelerimin niyetlerinizi yansıttığını kontrol edin! Her zaman daha fazlasını düzenleyebilirsiniz. Cc ila @gung.
amip diyor Reinstate Monica

Yanıtlar:


15

Bu teknik olmayan bir cevap olacak.

Haklısınız: PCA, esasen, her başarılı eksen mümkün olduğunca çok varyansı yakalayacak şekilde seçilen koordinat eksenlerinin bir rotasyonudur.

Bazı disiplinlerde (örneğin psikoloji gibi) insanlar ortaya çıkan eksenleri yorumlamak için PCA uygulamayı severler. Yani, ana eksen # 1'in (orijinal değişkenlerin belirli bir lineer kombinasyonu olan) belirli bir anlamı olduğunu söylemek isterler. Bu anlamı tahmin etmek için, lineer kombinasyondaki ağırlıklara bakarlardı. Bununla birlikte, bu ağırlıklar genellikle dağınıktır ve net bir anlam ayırt edilemez.

Bu durumlarda, insanlar bazen vanilya PCA çözeltisiyle biraz uğraşmayı seçerler. Belli sayıda ana ekseni alırlar (bazı ölçütler tarafından "anlamlı" kabul edilir) ve ek olarak , "basit yapı" elde etmeye çalışarak, yani yorumlanması daha kolay olan doğrusal kombinasyonları elde etmeye çalışarak döndürürler. Mümkün olan en basit yapıyı arayan belirli algoritmalar vardır; bunlardan birine varimax denir. Varimax rotasyonundan sonra, ardışık bileşenler artık mümkün olduğunca fazla sapma yakalamaz! PCA'nın bu özelliği, ek varimax (veya başka herhangi bir) dönüş yaparak kırılır.

Bu nedenle varimax döndürmeyi uygulamadan önce "döndürülmemiş" ana bileşenleriniz vardır. Daha sonra "döndürülmüş" temel bileşenler elde edersiniz. Başka bir deyişle, bu terminoloji , PCA rotasyonunun kendisini değil , PCA sonuçlarının sonradan işlenmesini ifade eder .


Tüm bunlar, döndürülen şeyin ana eksenler değil, yüklemeler olduğu gerçeğiyle biraz karmaşıktır. Ancak, matematiksel detaylar için sizi (ve ilgili herhangi bir okuyucuyu) buradaki uzun cevabıma yönlendiriyorum : PCA'nın ardından bir rotasyon (varimax gibi) hala PCA mı geliyor?


Henüz daha iyi ve net bir açıklama ile karşılaşmadım. Ayrıca sağladığınız diğer bağlantıdan da geçtim ama henüz toplamda deşifre edemiyorum. Eğer doğru anladıysam, rotasyona uğramayan temel bileşenler zaten dik ve ilişkisizdir. Burada biraz karışıklık var - PC'ler ardışık maksimum varyansa karşılık geldiğinden, ilk PC bulunduktan sonra, ikinci maksimum varyans çizgisinin (ikinci PC) birincisine 90 derece (ortogonal) olması gerekir. ?
Srewashi Lahiri

Bu doğru: "döndürülmemiş" ana bileşenler ilişkisizdir ve "döndürülmemiş" ana eksenler diktir. Ve evet, birbirini takip eden ana eksenlerin, öncekilerle ilişkisiz dik ve temel bileşenler olması gerekir (biri bunu matematiksel olarak kanıtlayabilir). Bu arada, bu (veya başka bir) cevabın sizin için sorunu çözdüğünü düşünüyorsanız, soldaki yeşil onay işaretine tıklayarak "kabul edebilirsiniz". 15 itibara ulaştığınızda, yararlı bulduğunuz cevapları da yükseltebilirsiniz (bence şu anda herhangi bir cevabı kaldıramazsınız).
amip, Reinstate Monica

+1. what gets rotated are loadings and not principal axes as suchBunun teknik bir kavram olduğunu da ekleyebilirim. Teorik olarak, bu iki rotasyon tipi yan yanadır. PCA'da spesifik ortogonal temeli (öz değerlerin en dik eğri grafiğine sahip olanı) bulmak için döneriz. Varimax'ta, başka bir spesifik dikey temel bulmak için döneriz (en çok interpetabl yapı ile). Her türlü dik temeli yapabiliriz.
ttnphns

Mümkünse layman terimleriyle açıklanamayan PC'nin ne anlama geldiğini açıklayabilir misiniz?
sai_636

@ sai_636 Layman şartları için lütfen stats.stackexchange.com/questions/2691 adresine bakın .
amip, Reinstate Monica'nın
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.