Genel olarak, katsayıları düzgün bir şekilde karşılaştırmak için bağımsız değişkenlerimi regresyonlarda standardize ederim (bu şekilde aynı birimlere sahip olurlar: standart sapmalar). Ancak, panel / boyuna verilerle, özellikle hiyerarşik bir model tahmin edersem verilerimi nasıl standartlaştırmam gerektiğinden emin değilim.
Neden potansiyel bir sorun olabileceğini görmek için, dönemleri boyunca ölçülen bireye sahip olduğunuzu ve bağımlı bir değişkeni, ve bir bağımsız değişkeni . Tam bir havuz gerilemesi çalıştırırsanız, verilerinizi şu şekilde standartlaştırmanız uygundur: , çünkü t- istatistiktir. Öte yandan, keşfedilmemiş bir regresyon, yani her bir birey için bir regresyon takarsanız, verilerinizi tüm veri kümesine değil (yalnızca R kodunda) değil, yalnızca bireye göre standartlaştırmalısınız:
for (i in 1:n) {
for ( t in 1:T) x.z[i] = (x[i,t] - mean(x[i,]))/sd(x[i,])
}
Bununla birlikte, bireyler tarafından değişen bir kesişme ile basit bir hiyerarşik model takarsanız, bir büzülme tahmincisi kullanırsınız, yani, havuzlanmış ve havuzsuz regresyon arasında bir model tahmin edersiniz. Verilerimi nasıl standartlaştırmalıyım? Tüm verileri birleştirilmiş regresyon gibi mi kullanıyorsunuz? Sadece taksim edilmemiş dava gibi bireyleri mi kullanıyorsunuz?