Yanıt 4. kök tarafından dönüştürüldüğünde regresyon katsayıları nasıl yorumlanır?


20

1/4Heterossedastisitenin bir sonucu olarak yanıt değişkenimde dördüncü root ( ) güç dönüşümü kullanıyorum . Ama şimdi regresyon katsayılarımı nasıl yorumlayacağımdan emin değilim.

Geri dönüşümü yaparken katsayıları dördüncü güce götürmem gerektiğini varsayıyorum (regresyon çıktısının altına bakınız). Tüm değişkenler milyonlarca dolar cinsindendir, ancak milyarlardaki dolar değişimini bilmek istiyorum.

Diğer bağımsız değişken sabit tutarken, ortalama ücretlerde milyar dolarlık bir değişim, tahsilatlarda 32(veya 32.000 dolar) bir değişikliğe yol açıyor . 0.000075223 * 1000(Milyarlara ulaşmak için) alıyorum ^ 4 = 0.000032. Şimdi bu sayıyı 1 milyon veya 1 milyarla çarpıyorum (bağımlı değişkenin orijinal birimi milyonlarca)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913

Yanıtlar:


24

En iyi çözüm, başlangıçta, çalışma alanında bir anlamı olan bir yeniden ifade seçmektir.

Bağımsız etkenlere karşı vücut ağırlıkları gerileme zaman (Örneğin, büyük olasılıkla bir küp kök (ya da budur güç) ya da kare kökü ( 1 / 2 gücü) gösterilir. Bu ağırlığı kaydeden birim için iyi bir vekil, küp Kök karakteristik bir doğrusal boyutu temsil eden bir uzunluktur.Bu sezgisel, potansiyel olarak yorumlanabilir bir anlam kazandırır.Kare kökün kendisinin bu kadar net bir yorumu olmamasına rağmen, 2'ye yakındır.1/31/2 boyutlara sahip güç,yüzey alanı: Bu toplam cilt alanına karşılık gelebilir.)2/3

Dördüncü güç, anlamları iyi anlaşılan günlüğü kullanmayı düşünmeniz gereken logaritmaya yeterince yakındır . Ancak bazen gerçekten bir küp kökü veya kare kök veya böyle bir kesirli gücün harika bir iş yaptığını ve açık bir yorumu olmadığını görüyoruz. O zaman biraz aritmetik yapmalıyız.

Söz gösterilen regresyon modeli bağımlı değişkeni içeren ( "Koleksiyonları") ve iki bağımsız değişkenler X 1 ( "Ücretler") ve X, 2YX1X2 ( "dir"). Bunu ortaya koyuyor

Y1/4=β0+β1X1+β2X2+ε.

Kod tahminleri olarak b 0 = 2.094573355 , β 1 olarak b 1 = 0.000075223 ve β 2 olarak b 2 = ,000022279 . Ayrıca varsaymaktadır ε sıfır ortalama normal iid ve (gösterilmemiştir) ortak varyansı tahmin eder. Bu tahminlerden, yerleştirilen değeri, Y 1 / 4 olduğuβ0b0=2.094573355β1b1=0.000075223β2b2=0.000022279εY1/4

Y1/4^=b0+b1X1+b2X2.

"Yorumlama" regresyon katsayıları normalde bağımlı değişkente hangi değişikliğin, her bağımsız değişkente belirli bir değişiklik tarafından önerildiğinin belirlenmesi anlamına gelir. Bu değişiklikler , Zincir Kuralının bize 4 β i Y'ye eşit olduğunu söylediği türevleridirdY/dXi . O zaman tahminleri ekleriz ve şöyle bir şey söylerdik4βiY3

Bir birim değiştirmek Regresyon tahminleri bir değişiklik ile bağlantılı olan Y ve 4 b ı -Y 3 = 4 b i ( b 0 + b 1 x 1 + b 2 x 2 ) 3 .XiY4biY^34bi(b0+b1X1+b2X2)3

Yorumlama bağımlılığı ve X 2 , sadece, bir deyişle ifade edilmezX1X2 hiçbir dönüşüm ile durumlarda farklı (bir birim değiştirmek X i bir değişikliği ile ilişkili b i içinde Y ) ya da logaritma (bir ile yüzde değişiklik, X i ile ilişkilidir b ı değişim yüzdesi Y ). Ancak, yorumun ilk biçimini koruyarak ve hesaplayarak 4 b 1 = 4 × 0.000075223 = 0.000301YXibiYXibiY4b14×0.0000752230.000301, şöyle bir şey söyleyebiliriz

Ücretlerdeki birim değişiklik , güncel koleksiyon küpünün değişikliklerle ilişkilidir ; örneğin, güncel tahsilatlar 10 ise ücretlerdeki birim artış, tahsilatlarda 0.301'lik bir artış ile ilişkilidir ve mevcut tahsilatlar 20 ise , aynı ücretlerdeki birim artış , tahsilatlardaki 2.41'lik bir artış ile ilişkilidir .0.000301100.301202.41


Dördüncü dışında kökleri alırken - diyelim ki, yerine Y yerine yanıt olarak Y p kullanıldığında , p nonzero ile - bu analizdeki tüm " 4 " görünümlerini " 1 / p " ile değiştirin. YpYp41/p


12

Burada dönüşümün bir alternatifi, bağlantı fonksiyonu gücü ve gücü 1/4 olan genelleştirilmiş doğrusal bir model kullanmaktır. Kullanılacak hata ailesi açıktır, bu da lineer regresyon ve koşullu normallik varsayımı ile sahip olduğunuzdan daha fazla esneklik sağlar. Bu prosedürün en büyük avantajlarından biri, tahminlerin orijinal ölçüm ölçeğinde otomatik olarak üretilmesidir, bu nedenle geri dönüştürme sorunu yoktur.


4

Günlükleri almaktan (ve gözlemleri düşürmekten) kaçınırken, yüzde değişiklikleri hakkında düşünmede çeyrek kök regresyon katsayılarını kullanan makaleler gördüm.

Yüzde değişikliklerini hesaplamak için dörtlü kökleri kullanmak istiyorsak şunu biliyoruz:

Y^=(α+β^1X1+β^2X2)4dY^dX1=4β^1(α+β^1X1+β^2X2)3

YXX

dY^/dX1Y=4β^1α+β^1X1+β^2X2

YX

dY^dX1X1Y^=4β^1X1α+β^1X1+β^2X2

Özellikle uygun görünmüyor (günlük dönüşümünü tercih ediyorum), ancak değerlendirerek yapılabilirX değerlerini örnek araçlarda veya varsayımsal değerlerde değerlendirerek yapılabilir.

Y1/4

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.