Temel bileşen analizinin (PCA) konu (ikili) alanda nasıl çalıştığını sezgisel bir şekilde anlamaya çalışıyorum .
İki değişken, 2D veri kümesi düşünün ve ve veri noktası (veri matrisi isimli ve ortalanmış olduğu varsayılmaktadır). PCA'nın olağan sunumu, noktasını dikkate almamız , kovaryans matrisini yazmamız ve özvektörlerini ve özdeğerlerini bulmamızdır; ilk PC maksimum varyans yönüne vb. karşılık gelir. İşte kovaryans matrisi . Kırmızı çizgiler, ilgili özdeğerlerin kare kökleri ile ölçeklendirilmiş özvektörleri gösterir.
Şimdi konu uzayında neler olduğunu düşünün (bu terimi @ttnphns'dan öğrendim), aynı zamanda ikili alan (makine öğreniminde kullanılan terim ) olarak da bilinir . Bu, iki değişkenimizin ( iki sütunu) örneklerinin iki vektör ve oluşturduğu boyutlu bir boşluktur . Her değişken vektörün karesi alınmış uzunluğu varyansına eşittir, iki vektör arasındaki açının kosinüsü aralarındaki korelasyona eşittir. Bu temsil, bu arada, çoklu regresyon tedavilerinde çok standarttır. Örneğimde, konu alanı şöyle görünüyor (sadece iki değişken vektörün kapsadığı 2B düzlemi gösteriyorum):
İki değişkenin doğrusal kombinasyonları olan temel bileşenler, aynı düzlemde ve vektörlerini oluşturacaktır . Benim sorum: böyle bir arsa üzerinde orijinal değişken vektörleri kullanarak temel bileşen değişken vektörlerinin nasıl oluşturulacağının geometrik anlayışı / sezgisi nedir? Verilen ve ne geometrik prosedür doğuracak ?
Aşağıda mevcut kısmi anlayışım var.
Her şeyden önce, temel bileşenleri / eksenleri standart yöntemle hesaplayabilir ve aynı şekilde çizebilirim:
Ayrıca, , (mavi vektörler) ile üzerindeki yansımaları arasındaki kare mesafelerin toplamının minimum şekilde ; bu mesafeler yeniden yapılandırma hatalarıdır ve siyah kesik çizgilerle gösterilmiştir. , her iki projeksiyonun kare uzunluklarının toplamını en üst düzeye çıkarır. Bu tamamen belirtir ve elbette birincil alandaki benzer açıklamaya tamamen benzerdir (Temel bileşen analizi, özvektörler ve özdeğerler anlamlandırma konusundaki animasyona bakın ). Ayrıca @ ttnphns'es yanıtının ilk bölümüne de bakın .
Ancak, bu yeterince geometrik değil! Bana böyle nasıl bulacağımı ve uzunluğunu belirtmiyor.
Benim tahminim olmasıdır , , ve bir elips tüm yalan ortalanan ile ve ana eksenleri olmak. Örneğimde şöyle görünüyor:
S1: Bunu nasıl kanıtlayabilirim? Doğrudan cebirsel gösteri çok sıkıcı görünmektedir; nasıl bakın bu durumda olması gerektiğini?
Ancak merkezli ve ve üzerinden geçen birçok farklı elips vardır :
S2: "Doğru" elipsi ne belirler? İlk tahminim, mümkün olan en uzun ana eksene sahip elips olmasıydı; ama yanlış gibi görünüyor (herhangi bir uzunlukta ana ekseni olan elipsler var).
Q1 ve Q2'ye cevaplar varsa, ikiden fazla değişken durumunda genelleme yapıp yapmadıklarını da bilmek istiyorum.
variable space (I borrowed this term from ttnphns)
- @amoeba, yanılmış olmalısın. (Başlangıçta) n boyutlu uzayda vektörler olarak değişkenlere özne alanı denir (n özne olarak n özne olarak "p değişkenleri" yayılırken "boşluk" olarak tanımlanır). Değişken alan , tam tersi, yani olağan dağılım grafiğidir. Çok değişkenli istatistiklerde terminoloji bu şekilde kurulur. (Makine öğreniminde farklıysa - bilmiyorum - o zaman öğrenciler için çok daha kötü.)
My guess is that x1, x2, p1, p2 all lie on one ellipse
Burada elipsin sezgisel yardımı ne olabilir? Şüpheliyim.