PCA'nın amacının boyutsallığı azaltmak olduğunu biliyorum
Bu genellikle insanların varsaydığı şeydir, ancak aslında PCA verilerinizin dik bir temsili olarak temsil edilmesidir. Bu temel hala orijinal verilerinizle aynı boyutluluğa sahiptir. Hiçbir şey kaybolmadı ... henüz. Boyutsallık azaltma kısmı tamamen size kalmış. PCA'nın sağladığı şey,kyeni projeksiyonunuzun boyutları en iyisidir kverilerinizin temsil edilebileceği boyutlar. En iyi ne anlama geliyor? Açıklanan varyans burada devreye girer.
açıkçası bu durumda değil
Bundan o kadar emin olmazdım! İkinci grafiğinizden, görsel olarak verilerinizden gelen birçok bilgi yatay bir çizgiye yansıtılabiliyor gibi görünüyor. Bu 2 boyutta olan orijinal arsa yerine 1 boyut! Açıkçası bazı bilgileri kaybediyorsunuz, çünkü Y eksenini kaldırıyorsunuz, ancak bu bilgi kaybının sizin için kabul edilebilir olup olmadığı sizin aramanızdır.
PCA'nın sitede ne olduğu ile ilgili bir sürü soru var, bu yüzden onları burada , burada , burada veya burada kontrol etmenizi öneririz . Bundan sonra başka sorularınız varsa, lütfen bunları gönderin, size yardımcı olmaktan memnuniyet duyarız.
Asıl sorunuz olarak:
PCA grafiğindeki sıcaklık vs dondurma hakkında anlatabileceğiniz hikaye nedir?
Yeni koordinat eksenleri orijinal koordinatların doğrusal bir kombinasyonu olduğundan, o zaman ... temelde hiçbir şey! PCA size aşağıdaki gibi bir cevap verecektir: (sayılar oluşur):
P C 1P C 2= 2,5 × dondurma - 3,6 × sıcaklık= - 1.5 × dondurma + 0.6 × sıcaklık
Bu sizin için yararlı mı? Olabilir. Ama tahmin etmem :)
Düzenlenen
Yararlı olduğunu düşündüğüm bu kaynağı ekleyeceğim çünkü etkileşimli grafikler harika.
Tekrar düzenlendi
En iyi olanı netleştirmek için k anlamına geliyor:
PCA, veriler üzerlerine yansıtıldığında en yüksek varyansı veren boyutları bulmaya çalışır. Verilerinizinn > k boyutlar, ilk k PC'ler verilerinizde diğerlerinden daha fazla varyansı açıklar kboyutları olabilir. En iyi demek istediğim bu k. Bunun sizin için yararlı olup olmadığı başka bir şeydir.