Veri normalizasyonu ile ilgili karışıklık


9

Doğrusal bir regresyon modelini öğrenmeye çalışıyorum. Ancak, verilerin normalleştirilmesi ile ilgili bazı karışıklıklarım var. Özellikleri / yordayıcıları sıfır ortalama ve birim varyansına normalleştirdim. Hedef için de aynısını yapmam gerekiyor mu? Öyleyse neden?


1
Özellikleri / tahmincileri neden normalleştirdiniz?
Peter Flom

4
BTW Bence 'standartlaştırma' bunun için daha iyi bir terim.
Scortchi - Monica'yı eski durumuna döndürün

Yanıtlar:


6

Hedefi doğrusal regresyonda normalleştirmek önemli değildir. Doğrusal regresyonda, formunuz formda olacaktır

y^ben=bir0+birxben.
Tahminciler xben merkezlenmiş, sabit terim bir0 her zaman demek olacak yben. Yani eğeryben bir regresyon yapmadan önce, bir0=0, ancak diğer tüm katsayılarınız değişmeden kalacaktır.

(Bununla birlikte, şu anda yaptığınız gibi - tahmincileri normalleştirmek iyi bir fikirdir.)


1
Neden tahmincileri normalleştirmek iyi bir fikir?
Scortchi - Monica'yı eski durumuna döndürün

@Stefan. Evet, tahmincileri ortaladığımda, sabit terimi alıyorumbir0y'nin ortalaması olmak. Ama bunun nasıl olacağı anlamına gelmedim. Arkasındaki matematiği söyleyebilir misin?
user34790

2
@Scortchi Tahminleyicileri normalleştirmek gerekli değildir, ancak regresyondaki katsayıların yorumlanmasını kolaylaştırabilir: Normalleştirmeden sonra büyük katsayılar önemli öngörücülere karşılık gelir. Ayrıca, normalizasyon olmadan, etkileşim terimlerinin katsayıları ciddi yanıltıcı olabilir. Bununla birlikte, normalleştirme modelinizden aldığınız tahminleri etkilemez, bu nedenle normalleştirme sadece regresyondaki katsayıları yorumlamak istediğinizde önemlidir.
Stefan Wager


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.