Değişkenleri değiştirmek / ölçeklendirmek yanıtla korelasyonlarını etkilemez
Bunun neden doğru olduğunu görmek için, Y ve X dır-dir ρ. Sonra arasındaki korelasyonY ve (X−a)/b dır-dir
cov(Y,(X−a)/b)SD((X−a)/b)⋅SD(Y)=cov(Y,X/b)SD(X/b)⋅SD(Y)=1b⋅cov(Y,X)1bSD(X)⋅SD(Y)=ρ
hangi aşağıdaki bağıntı tanımı ve üç gerçekler:
cov(Y,X+a)=cov(Y,X)+cov(Y,a)=0=cov(Y,X)
cov(Y,aX)=acov(Y,X)
SD(aX)=a⋅SD(X)
Bu nedenle, modele uyum açısından (ör.R2veya girilen değerler), değişkenlerinizi kaydırmak veya ölçeklendirmek (örneğin, bunları aynı ölçeğe koymak) modeli değiştirmeyecektir , çünkü doğrusal regresyon katsayıları değişkenler arasındaki korelasyonlarla ilişkilidir. Sadece regresyon katsayılarınızın ölçeğini değiştirecektir; bu, öngörücülerinizi dönüştürmeyi seçerseniz çıktıyı yorumlarken akılda tutulması gerekir.
Düzenleme: Yukarıdaki, kesişme ile normal regresyon hakkında konuştuğunuzu varsaymıştır . Bununla ilgili birkaç nokta daha (teşekkürler @cardinal):
Değişkenleri dönüştürdüğünüzde kesişme değişebilir ve yorumlarda @cardinal'in işaret ettiği gibi, kesişmeyi modelden çıkarırsanız değişkenlerinizi kaydırdığınızda katsayılar değişecektir, ancak bunu yapmadığınız sürece bunu yapmadığınızı varsayıyorum. iyi bir neden (örneğin bu cevaba bakınız ).
Katsayılarınızı bir şekilde düzenliyorsanız (örn. Kement, sırt regresyonu), merkezleme / ölçeklendirme uygunluğu etkiler. Örneğin, cezalandırıyorsanız∑β2i (sırt regresyon cezası), tüm değişkenler ilk etapta aynı ölçekte olmadıkça standartlaştırıldıktan sonra eşdeğer bir uyumu kurtaramazsınız, yani aynı cezayı geri kazanacak sabit bir kat yoktur.
Bir araştırmacının tahmincileri ne zaman / neden dönüştürmek isteyebileceğiyle ilgili olarak
Yaygın bir durum (@Paul tarafından sonraki cevapta tartışılmıştır) araştırmacıların tüm katsayıların aynı ölçekte olması için tahmincilerini standartlaştırmasıdır . Bu durumda, nokta tahminlerinin boyutu, tahmin edicinin sayısal büyüklüğü standart hale getirildikten sonra hangi tahmin edicilerin en büyük etkiye sahip olduğu hakkında kabaca bir fikir verebilir.
Bir araştırmacının çok büyük değişkenleri ölçeklendirmek isteyebilmesinin bir başka nedeni, regresyon katsayılarının çok küçük bir ölçekte olmamasıdır. Örneğin, bir ülkenin nüfus büyüklüğünün suç oranı üzerindeki etkisine bakmak istiyorsanız (daha iyi bir örnek düşünemedim), katsayıdan dolayı nüfus büyüklüğünü orijinal birimlerinden ziyade milyonlarca olarak ölçmek isteyebilirsiniz. gibi bir şey olabilir.00000001.