Kütle dönüştürülmüş yordayıcının ve / veya tepkinin yorumlanması


46

Merak ediyorum, yorumlamada sadece bağımlı, bağımsız veya bağımsız değişkenlerin mi yoksa sadece bağımsız değişkenlerin log dönüşümünde mi olduğunu fark eder mi?

Durumunu düşünün

log(DV) = Intercept + B1*IV + Error 

IV'ü yüzde artış olarak değerlendirebilirim, ancak sahip olduğumda bu nasıl değişir?

log(DV) = Intercept + B1*log(IV) + Error

veya sahipken

DV = Intercept + B1*log(IV) + Error

?


1
"Yüzde artış" yorumunun doğru olmadığını hissediyorum ama nedenini tam olarak söyleyecek kadar bilgim yok. Birisi yardımcı olabilir umarım .... Bunun ötesinde, eğer bir XY ilişkisi daha iyi kurulmasına yardım ederlerse, günlükleri kullanarak modellemeyi öneririm , ancak orijinal değişkenleri kullanarak bu ilişkinin seçilmiş örneklerini bildiririm . Özellikle de teknik olarak anlayışlı olmayan bir kitleyle ilgileniyorsanız.
rolando2

3
@ rolando2: Katılıyorum. Eğer geçerli bir model dönüşüm gerektiriyorsa, geçerli bir yorum genellikle dönüştürülen modelin katsayılarına dayanacaktır. Araştırmacının, bu katsayıların anlamını izleyiciye uygun bir şekilde iletmesi için bir sakınca yoktur. Tabii ki, neden böyle büyük paralar alıyoruz ki, maaşların her şeyden önce kütüğün dönüştürülmesi gerekiyor.
jthetzel 19:11

1
@BBBucks: Peki, bu şekilde bak. Hedef kitlenizin, X'in logundaki her bir değişiklik için (10 no'lu taban 10) Y'nin b ile değişeceğini açıkladığınızda ne demek istediğinizi anlayamadığınızı varsayalım. Ancak, 10, 100 ve 1000 X değerlerini kullanarak 3 örnek anlayabildiklerini varsayalım. Bu noktada muhtemelen ilişkinin doğrusal olmayan doğasını yakalayacaktır. Genel olarak, log tabanlı b raporunu yine de rapor edebilirsiniz, ancak bu örnekleri vermek her şeyi değiştirebilir.
rolando2

1
.... Şimdi aşağıdaki açıklamamı okuduğum halde, belki de bu "şablonları" kullanmak, bu tür sorunları anlamada birçoğumuzun anlaşılmasına yardımcı olabilir.
rolando2

Yanıtlar:


42

Charlie güzel, doğru bir açıklama sunar. UCLA’daki İstatistik Hesaplama sitesinde bazı başka örnekler de var: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm ve http://www.ats.ucla.edu/stat/mult_pkg/ sss / genel / log_transformed_regression.htm

Sadece Charlie'nin cevabını tamamlamak için, örneklerinizin spesifik yorumları aşağıdadır. Her zaman olduğu gibi, katsayı yorumları, modelinizi savunabileceğinizi, regresyon tanılarının tatmin edici olduğunu ve verilerin geçerli bir çalışmadan geldiğini varsayar.

Örnek A : Dönüşüm yok

DV = Intercept + B1 * IV + Error 

"IV'teki bir B1birim artış, DV'deki bir ( ) birim artışla ilişkilidir ."

Örnek B : Dönüştürülen sonuç

log(DV) = Intercept + B1 * IV + Error 

"IV'teki bir birim artış, DV'deki ( B1 * 100) bir artışla ilişkilidir ."

Örnek C : Maruziyet dönüşümü

DV = Intercept + B1 * log(IV) + Error 

"IV'te yüzde bir artış, DV'de bir ( B1 / 100) birim artışla ilişkilidir ."

Örnek D : Sonuç dönüşümü ve dönüşüm dönüşümü

log(DV) = Intercept + B1 * log(IV) + Error 

"IV'te B1yüzde bir artış, DV'de ( ) yüzde bir artışla ilişkilidir ."


1
Bu yorumlar logaritmanın temeli ne olursa olsun geçerli midir?
Ayalew A.

Örnek B: Sonuca dönüştürülmüş log (DV) = Kesişme + B1 * IV + Hata "IV'teki bir birim artış, DV'de yüzde (B1 * 100) artışla ilişkilidir. Bu durumda, 30 pourcent istiyorsanız DV azaltma? Cevabınız için teşekkür ederiz
Antouria

Yani bir DV ~ B1 * log (IV) sıfır bağlı sürekli bağımlı değişken için iyi bir modeldir?
Bakaburg

2
Kafam karışmış olabilir. Sonucu log-dönüştürürseniz, çarpma farkını bulmak için katsayıyı yeniden yükseltmelisiniz. Günlük ölçeğinde yorumlamak, yalnızca oranın 1'e çok yakın olduğu durumlarda yaklaşık bir değer olarak çalışır.
AdamO

Bağlantılar koptu.
Nick Cox,

22

Log-log modelde, görüyoruz Hatırlatma; veya Bu son formülasyonu 100 ile çarpmak, yüzde değişimi verir . için benzer sonuçlarımız var .

β1=log(y)log(x).
log(y)y=1y
log(y)=yy.
yx

Bu gerçeği kullanarak, yorumlayabilir yüzde değişme olarak yüzde 1'lik bir değişim için .β1yx

Aynı mantığın ardından seviye-log modeli için,

β1=ylog(x)=100y100×log(x).
veya , yüzde bir değişiklik için birimindeki değişimdir .β1/100yx

Bunu asla anlamadım. Dümdüz ileri olmalı, ama hiç görmedim ... Tam olarak ne oldu ve buradan yüzde bir değişime nasıl geçersiniz?
log(y)=yy?
B_Miner

1
Bütün bu hat türevini almak does göre ile ve çarpma her iki . Biz . Bu fraksiyon, daha sonra değişim bölü . 100 ile çarpıldığında, bu cinsinden değişim yüzdesidir . log(y)yyyy1y0yyy
Charlie

7

Doğrusal regresyonun asıl amacı, bir regresörün bitişik seviyelerini karşılaştıran sonuçların ortalama farkını tahmin etmektir. Birçok araç türü vardır. En çok aritmetik ortalamayı biliyoruz.

AM(X)=(X1+X2++Xn)n

AM, OLS ve dönüştürülmemiş değişkenler kullanılarak tahmin edilen şeydir. Geometrik ortalama farklıdır:

GM(X)=(X1×X2××Xn)n=exp(AM(log(X))

görüntü tanımını buraya girin

Pratik olarak bir GM farkı çarpımsal bir farktır: bir kredi varsayarken faiz oranının% X'ini ödersiniz, hemoglobin seviyeleriniz metformine başladıktan sonra% X'i düşürür, yayların kırılma oranı genişliğin bir kısmı olarak% X'i artırır. Tüm bu durumlarda, ham ortalama fark daha az anlamlı olur.

Log dönüşümü, geometrik bir ortalama farkı tahmin eder. Günlüğü bir sonucu dönüştürürseniz ve aşağıdaki formül özelliğini kullanarak doğrusal bir regresyonda modellerseniz:log(y) ~ x katsayısı , bitişik birimlerini karşılaştıran günlük çıktısının ortalama farkıdır . Bu pratik olarak işe yaramaz, bu yüzden parametresini ve bu değeri geometrik bir ortalama farkı olarak yorumluyoruz. X e β 1β1Xeβ1

Örneğin, 10 haftalık ART uygulamasından sonraki HIV viral yükü çalışmasında, geometrik ortalamasını tahmin edebiliriz . Yani viral yük ne olursa olsun, başlangıçta ortalama % 60 daha düşüktü veya takipte 0.6 kat azaldığı anlamına gelir. Yük, başlangıçta 10.000 olsaydı, modelim takipte 4.000 olacağını, başlangıçta 1.000 olsaydı, modelim takipte 400 olacağını tahmin ederdi (ham ölçekte daha küçük bir fark vardı, ancak orantılı olarak aynı).eβ1=0.40

Bu, diğer cevaplardan önemli bir ayrımdır : log ölçeği katsayısının 100 ile çarpılması konvansiyonu, küçük olduğunda gelir . Katsayı (log skalasında) 0,05 ise, o zaman ve yorum: 1 birim "artış" için sonuçta% 5 "artış" . Bununla birlikte, katsayısı daha sonra 0.5 ise ve% 65 "artış" olarak yorumlanması bir 1 birimi "artış" için . % 50 artış değildir.X exp ( 0.05 ) 1.05 x exp ( 0.5 ) = 1.65 , Y Xlog(x)1xXexp(0.05)1.05Xexp(0.5)=1.65YX

Biz öngorücunun dönüşümü log varsayalım: y ~ log(x, base=2). İşte, bir çarpımsal değişim ilgilenen am yerine çiğ fark. Şimdi 2 kat farklı olan katılımcıları karşılaştırmakla ilgileniyorum . Örneğin, ilave risk modeli kullanarak çeşitli konsantrasyonlarda kan kaynaklı patojene maruz kalmanın ardından enfeksiyonun (evet / hayır) ölçülmesi ile ilgilendiğimi varsayalım. Biyolojik model, konsantrasyonun her iki katına çıkması için riskin orantılı olarak arttığını önerebilir. Sonra, , ancak tahmini katsayısı bulaşıcı maddenin iki kat konsantrasyon farkına maruz kalan grupları karşılaştıran risk farkı olarak yorumlanıyor.X β 1xXβ1

Son olarak, log(y) ~ log(x)basitçe her iki tanımı da maruz kalma seviyelerinde çarpma bakımından farklı olan grupları karşılaştıran çoklayıcı bir fark elde etmek için uygulanır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.