Panel / boyuna verilerle verilerinizi bir gerilemede standartlaştırmak iyi bir uygulama mı?


16

Genel olarak, katsayıları düzgün bir şekilde karşılaştırmak için bağımsız değişkenlerimi regresyonlarda standardize ederim (bu şekilde aynı birimlere sahip olurlar: standart sapmalar). Ancak, panel / boyuna verilerle, özellikle hiyerarşik bir model tahmin edersem verilerimi nasıl standartlaştırmam gerektiğinden emin değilim.

Neden potansiyel bir sorun olabileceğini görmek için, dönemleri boyunca ölçülen bireye sahip olduğunuzu ve bağımlı bir değişkeni, ve bir bağımsız değişkeni . Tam bir havuz gerilemesi çalıştırırsanız, verilerinizi şu şekilde standartlaştırmanız uygundur: , çünkü t- istatistiktir. Öte yandan, keşfedilmemiş bir regresyon, yani her bir birey için bir regresyon takarsanız, verilerinizi tüm veri kümesine değil (yalnızca R kodunda) değil, yalnızca bireye göre standartlaştırmalısınız:i=1,,nt=1,,Tyi,txi,tx.z=(xmean(x))/sd(x)

for (i in 1:n) {
  for ( t in 1:T) x.z[i] =  (x[i,t] - mean(x[i,]))/sd(x[i,]) 
}

Bununla birlikte, bireyler tarafından değişen bir kesişme ile basit bir hiyerarşik model takarsanız, bir büzülme tahmincisi kullanırsınız, yani, havuzlanmış ve havuzsuz regresyon arasında bir model tahmin edersiniz. Verilerimi nasıl standartlaştırmalıyım? Tüm verileri birleştirilmiş regresyon gibi mi kullanıyorsunuz? Sadece taksim edilmemiş dava gibi bireyleri mi kullanıyorsunuz?

Yanıtlar:


10

Standartlaşmanın sıradan regresyonda veya uzunlamasına bir modelde iyi bir fikir olduğunu göremiyorum. Tahminleri elde etmeyi zorlaştırır ve genellikle çözülmesi gereken bir sorunu çözmez. Ve modelde ve varsa . nasıl standartlaştırıyorsunuz ? Modelde sürekli değişken ve ikili değişken varsa ne olur? İkili değişkeni nasıl standartlaştırırsınız? Kesinlikle düşük yaygınlık değişkenlerinin daha fazla önem vermesine neden olacak standart sapması ile değil.xx2x2

Genel olarak model efektlerini orijinal ölçeğinde yorumlamak en iyisidir .x


@Frank Harrell - ana hatlarıyla ortaya koyduğunuz koşullarla ilgili sorunlar hakkında iyi noktalar, ancak farklı ölçeklerde tüm sürekli değişkenler varsa, o zaman standartlaştırma eğimleri karşılaştırmanın tek yolu değil midir?
DQdlM

1
@Frank, sanırım hangi tür modelleri çalıştırdığınıza bağlı, ancak tahmin değişkenlerinin standardizasyonu genellikle yararlıdır. Bunları ortalamak, kesişmenin ortalama tahmin edilen sonuç olarak yorumlanabilir hale gelmesi ve farklı öngörücülerin göreceli öneminin daha belirgin hale gelmesi anlamına gelir. Genellikle ikili tahmincileri yalnız bırakıyorum, ancak bazen diğer ölçeklendirme seçenekleri göz önünde bulundurulmaya değer. Son olarak, bazı durumlarda, çok farklı standart sapmalara sahip öngörücülere sahip olmak hesaplama / yakınsama sorunlarına yol açabilir.
Michael Bishop

2
R,2χ2

1
İkili değişkenleriniz varsa, bunları standartlaştırmayın, sadece sürekli olanı. Gelman'ın bu makaleye bakınız (< stat.columbia.edu/~gelman/research/published/standardizing7.pdf >, değişkenleri iki standart sapma ile bölmeyi önermektedir . Her durumda, bir Bayes modeli takıyorsanız yakınsamaya yardımcı olur.
Manoel Galdino

xx2

0

Farklı ölçeklerle ölçülen değişkenleri aynı metriğe getirmek için standardizasyona bir alternatif vardır. Buna Maksimum Ölçekleme Oranı (POMS) denir ve z-dönüşümü yapma eğiliminde olduğu için çok değişkenli dağılımlarla uğraşmaz.

Todd Little, uzunlamasına yapısal eşitlik modellemesi kitabında z-standardizasyon üzerine POMS'u açıkça önermektedir. Uzunlamasına verilerle uğraşırken Z-dönüşümü ek sorunlarla birlikte gelir, buraya bakın: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4569815/

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.