Doğrusal regresyonun asıl amacı, bir regresörün bitişik seviyelerini karşılaştıran sonuçların ortalama farkını tahmin etmektir. Birçok araç türü vardır. En çok aritmetik ortalamayı biliyoruz.
AM(X)=(X1+X2+…+Xn)n
AM, OLS ve dönüştürülmemiş değişkenler kullanılarak tahmin edilen şeydir. Geometrik ortalama farklıdır:
GM(X)=(X1×X2×…×Xn)−−−−−−−−−−−−−−−−−√n=exp(AM(log(X))
Pratik olarak bir GM farkı çarpımsal bir farktır: bir kredi varsayarken faiz oranının% X'ini ödersiniz, hemoglobin seviyeleriniz metformine başladıktan sonra% X'i düşürür, yayların kırılma oranı genişliğin bir kısmı olarak% X'i artırır. Tüm bu durumlarda, ham ortalama fark daha az anlamlı olur.
Log dönüşümü, geometrik bir ortalama farkı tahmin eder. Günlüğü bir sonucu dönüştürürseniz ve aşağıdaki formül özelliğini kullanarak doğrusal bir regresyonda modellerseniz:log(y) ~ x
katsayısı , bitişik birimlerini karşılaştıran günlük çıktısının ortalama farkıdır . Bu pratik olarak işe yaramaz, bu yüzden parametresini ve bu değeri geometrik bir ortalama farkı olarak yorumluyoruz. X e β 1β1Xeβ1
Örneğin, 10 haftalık ART uygulamasından sonraki HIV viral yükü çalışmasında, geometrik ortalamasını tahmin edebiliriz . Yani viral yük ne olursa olsun, başlangıçta ortalama % 60 daha düşüktü veya takipte 0.6 kat azaldığı anlamına gelir. Yük, başlangıçta 10.000 olsaydı, modelim takipte 4.000 olacağını, başlangıçta 1.000 olsaydı, modelim takipte 400 olacağını tahmin ederdi (ham ölçekte daha küçük bir fark vardı, ancak orantılı olarak aynı).eβ1=0.40
Bu, diğer cevaplardan önemli bir ayrımdır : log ölçeği katsayısının 100 ile çarpılması konvansiyonu, küçük olduğunda gelir . Katsayı (log skalasında) 0,05 ise, o zaman ve yorum: 1 birim "artış" için sonuçta% 5 "artış" . Bununla birlikte, katsayısı daha sonra 0.5 ise ve% 65 "artış" olarak yorumlanması bir 1 birimi "artış" için . % 50 artış değildir.X exp ( 0.05 ) ≈ 1.05 x exp ( 0.5 ) = 1.65 , Y Xlog(x)≈1−xXexp(0.05)≈1.05Xexp(0.5)=1.65YX
Biz öngorücunun dönüşümü log varsayalım: y ~ log(x, base=2)
. İşte, bir çarpımsal değişim ilgilenen am yerine çiğ fark. Şimdi 2 kat farklı olan katılımcıları karşılaştırmakla ilgileniyorum . Örneğin, ilave risk modeli kullanarak çeşitli konsantrasyonlarda kan kaynaklı patojene maruz kalmanın ardından enfeksiyonun (evet / hayır) ölçülmesi ile ilgilendiğimi varsayalım. Biyolojik model, konsantrasyonun her iki katına çıkması için riskin orantılı olarak arttığını önerebilir. Sonra, , ancak tahmini katsayısı bulaşıcı maddenin iki kat konsantrasyon farkına maruz kalan grupları karşılaştıran risk farkı olarak yorumlanıyor.X β 1xXβ1
Son olarak, log(y) ~ log(x)
basitçe her iki tanımı da maruz kalma seviyelerinde çarpma bakımından farklı olan grupları karşılaştıran çoklayıcı bir fark elde etmek için uygulanır.