Doğrusal regresyonda standartlaştırılmış açıklayıcı değişkenlerin ne zaman ve nasıl kullanılacağı


37

Doğrusal regresyon ile ilgili 2 basit sorum var:

  1. Açıklayıcı değişkenleri ne zaman standart hale getirmeniz önerilir?
  2. Tahmin, standartlaştırılmış değerlerle yapıldıktan sonra, yeni değerlerle nasıl tahmin edilebilir (yeni değerleri nasıl standartlaştırmalı)?

Bazı referanslar yardımcı olabilir.


3
Yazılımınız iyi yazılmışsa, sayısal hassasiyet problemlerini önlemek için otomatik olarak dahili olarak standartlaşır. Özel bir şey yapmamalısın.
whuber

1
Aşağıdaki konu başlığının ilişkili olduğunu ve ilgi çekici olacağını unutmayın: Verilerinizi ne zaman merkezlemelisiniz ve ne zaman standartlaştırmalısınız? .
gung - Reinstate Monica

Yanıtlar:


26

Terminoloji tartışmalı bir konu olmasına rağmen, "açıklayıcı" değişkenler, "yordayıcı" değişkenler demeyi tercih ederim.

Öngörüler ne zaman standartlaştırılmalıdır:

  • Çoklu doğrusal regresyon gerçekleştirmek için kullanılan birçok yazılım, öngörücüleri ve yanıt değişkenini manuel olarak standartlaştırdığınız standartlaştırılmamış katsayılara eşdeğer standartlaştırılmış katsayılar sağlayacaktır (elbette, yalnızca standartlaştırıcılardan bahsetmişsiniz gibi geliyor).
  • Benim düşünceme göre standardizasyon, regresyon denklemlerini daha anlamlı hale getirmek için kullanışlı bir araç. Bu, özellikle değişken değişken metriğinin regresyon denklemini yorumlayan kişi için anlamsız olduğu durumlarda geçerlidir (örneğin, keyfi bir metrikteki psikolojik bir ölçek). Tahmini değişkenlerin göreceli öneminin karşılaştırılabilirliğini kolaylaştırmak için de kullanılabilir (göreceli önemi değerlendirmek için daha sofistike yaklaşımlar mevcut olsa da; tartışma için yazıma bakınız ). Metriğin regresyon denklemini yorumlayan kişi için anlamı olduğu durumlarda, standartlaştırılmamış katsayılar genellikle daha bilgilendiricidir.
  • Ayrıca, standartlaştırılmış değişkenlere güvenmenin, bir değişkenin metriğini okuyucu için daha anlamlı hale getirme konusunda düşünmemiş olmamızdan dikkat çekebileceğini düşünüyorum.

  • Andrew Gelman'ın konuyla ilgili söyleyecek çok şeyi var. Onun Bkz standardizasyon sayfayı örneğin ve için Gelman (2008, İstatistikler Med ÜCRETSİZ PDF) özellikle.

Standardizasyona dayalı tahmin:

  • Tahmin için standartlaştırılmış regresyon katsayılarını kullanmazdım.
  • Orijinal örnekteki tahmin değişkeninin ortalamasını ve standart sapmasını biliyorsanız, standartlaştırılmış katsayıları standartlaştırılmamış katsayılara her zaman dönüştürebilirsiniz.

3
+1, neden tahmin için standartlaştırılmamış regresyon katsayılarını kullanmıyorsunuz?
9'da

1
(+1) Değişken önemini değerlendirme konusunda, relaimpo R paketinin iyi bir iş çıkardığını düşünüyorum (ancak bkz . Modern Regresyon Yaklaşımı ). David V. Budescu tarafından baskınlık analizi üzerine güzel bir yazı da vardı (istek üzerine serbestçe temin edilebilir).
chl

@onestep ayy. yazım hatası. Şimdi değişti.
Jeromy Anglim

1
@Jeromy, neden tahmin için standartlaştırılmış regresyon katsayılarını kullanmadığınızı açıklayabilir misiniz?
Michael Bishop

3
@MichaelBishop Regresyon modelinizi alıp örnek verilerden tahmin etmek için uyguladığınız bağlamları düşünüyorum. Genel olarak, standartlaştırılmamış tahminler istersiniz. Ayrıca, örnekler arasında ortalamalar ve standart sapmalar değişebilir; Bu nedenle standartlaştırılmamış öngörücülerin kullanılması daha anlamlı sonuçlar vermelidir.
Jeromy Anglim

-4

Daha önce yazılmış mükemmel cevap ile örtüşebilecek kısa bir cevap hamuru ile cevap vereyim.

  1. Her zaman standardize edin; bu, regresyonu, özellikle de regresyonun katsayılarını daha iyi yorumlamanızı sağlar.

  2. Standart olmayan yeni veriler için, maksimum ve minimum gibi standartlaştırılacak her değişken için kullandığınız değerleri saklamanızı ve daha sonra sadece bunun için delik veri setinde yaptığınız dönüşümü yapın. tek örnek.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.