Zaten matematiksel özelliklere odaklanan cevaplara ek olarak, deneysel bir bakış açısıyla yorum yapmak istiyorum.
Özet: veri oluşturma süreçleri genellikle verileri temel bileşen (PCR) veya kısmi en küçük kareler (PLS) regresyonu için uygun kılacak şekilde optimize edilir.
Ben analitik kimyacıyım. Bir şeyi ölçmek (regresyon veya sınıflandırma) için bir deney / yöntem tasarlarken, eldeki göreve göre gürültü / gürültü oranına iyi bir sinyal taşıyan veriler elde etmek için uygulama ve mevcut araçlar hakkındaki bilgimi kullanırım. Bu, ürettiğim verilerin ilgilenilen özelliğe sahip büyük kovaryansa sahip olacak şekilde tasarlandığı anlamına geliyor.
Bu, ilginç varyansın büyük olduğu ve daha sonraki bilgisayarların yalnızca (küçük) gürültüyü taşıyacağı bir varyans yapısına yol açar.
Daha sağlam veya daha kesin sonuçlar elde etmek için eldeki görev hakkında gereksiz bilgiler veren yöntemleri de tercih ederim. PCA yedekli ölçüm kanallarını bir PC'de toplar, bu da daha sonra çok değişkenlik gösterir ve bu nedenle ilk bilgisayarlardan biridir.
İlgilenilen mülk ile ilişkili olmayan büyük varyansa neden olacak bilinen karmakarışıklıklar varsa, verilerin önişlemesi sırasında genellikle bunları mümkün olduğunca düzeltmeye çalışacağım: çoğu durumda bu karmakarışıklıklar bilinen bir konudur. fiziksel veya kimyasal nitelikte olup, bu bilgi karıştırıcıları düzeltmek için uygun yollar önerir. Örneğin, mikroskop altında Raman spektrumunu ölçtüm. Yoğunluğu, lazer ışığının yoğunluğuna ve ayrıca mikroskobu ne kadar iyi odaklayabileceğime bağlıdır. Her ikisi de, örneğin sabit olduğu bilinen bir sinyale normalleştirilerek düzeltilebilecek değişikliklere yol açar.
Bu nedenle, çözüme katkıda bulunmayan büyük varyans katkıda bulunanlar, veriler PCA'ya girmeden önce ortadan kaldırılmış ve ilk PC'lerde çoğunlukla anlamlı farklar bırakmıştır.
Son fakat en az değil, burada bir miktar kendi kendine yeten kehanet var: Açıkçası, varyans taşıyan bilginin büyük olduğu varsayımının anlamlı olduğu varsayımına göre veriler PCR ile yapıldı. Örneğin, nasıl düzelteceğimi bilmediğim önemli kargaşaların olabileceğini düşünürsem, derhal tahmin görevine yardımcı olmayan büyük katkıları görmezden gelmekte olan PLS'ye giderdim.