Verilerin merkezlenmesi regresyon ve PCA'daki engellemelerden nasıl kurtulur?


38

Kesintiyi kaldırmak için ( bu soruda bahsedildiği gibi) verileri merkezlediğimiz örnekler (örneğin, düzenlileştirme veya PCA ile) hakkında okumaya devam ediyorum . Biliyorum basit, ama bunu sezgisel olarak anlamakta zorlanıyorum. Birisi sezgiyi verebilir veya okuyabileceğim bir referans verebilir mi?


2
Bu, istatistik.stackexchange.com/questions/17336/… adresinde anlatıldığı gibi (diğer şekillerde kontrol etme) çok özel bir durumdur . Kontrol edilen "değişken", sabit (kesişme) terimdir.
whuber

Yanıtlar:


63

Bu resimler yardımcı olabilir mi?

İlk 2 resim gerileme hakkında. Verileri ortalamak, regresyon çizgisinin eğimini değiştirmez, ancak 0'ı kesişir.

görüntü tanımını buraya girin

1

görüntü tanımını buraya girin


1


1
y¯-X¯β

15
PCA is maximizing varianceBu genel olarak doğru değildir. PCA, (1. PC ile) kökene göre kare sapma toplamını maksimuma çıkarır. Sadece veriler ön merkezliyse (kendini merkezleme PCA'nın bir parçası değil) varyansı maksimize ediyor.
ttnphns

3
PS Kovaryansların veya korelasyonların hesaplanmasının merkezleme anlamına
geldiğine dikkat edin

1
> PS Kovaryansların veya korelasyonların hesaplanmasının merkezleme anlamına geldiğini unutmayın - ttnphns 27:12 11:47 Ağustos 11 Diğer yorumlarınızla aynı fikirdeyim, hem kovaryans hem de korelasyon merkezleme anlamına gelmez. Verilere ilave bir sabit uygulandığında ne kor ne de kovar değer değiştirmez.
TPM

1
Bu geriye doğru. Katkı sabitleri gerçekten de korelasyonları etkilemez, ancak hesaplamaları çıkardıklarından, çünkü @ ttph'lerin işaret ettiği gibi. Bu bir yana, bu yeni bir cevap değil, yorum. Henüz yorum yapacak kadar itibarınız olmadığını anlıyoruz, bu nedenle, işaretleydikten sonra kullanıcı tarafından yeterince itibar göreceğine inanıyorum.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.