İki değişkenli kütükler arasında doğrusal bir ilişkiye sahip olmanın sezgisel anlamı nedir?


20

Birbirine karşı çizildiğinde çok fazla korelasyon göstermeyen iki değişkenim var, ancak her bir değişkenin günlüklerini birbiriyle karşılaştırdığımda çok net bir doğrusal ilişki var.

Böylece tür bir model ile sonuçlanır:

log(Y)=alog(X)+b
, ki bu matematiksel olarak harika ama normal bir doğrusal modelin açıklayıcı değerine sahip görünmüyor.

Böyle bir modeli nasıl yorumlayabilirim?


5
Mevcut cevaplara eklemek için önemli bir şeyim yok, ama sonuçta bir logaritma ve öngörücü bir esneklik. Bu terim için yapılan aramalar, ilişkiyi yorumlamak için çok sezgisel olmayan bazı iyi kaynaklar bulmalıdır.
Upper_Case-Stop Zarar Monica

Bağımlı değişkenin log (y) ve bağımsız değişkenin log (x) olduğu bir log-log modelinin yorumu: %Δ=β1%Δx .
Bob

3
Sonuç ikili (risk modeli) olduğunda ve maruz kalma birikimi, örneğin cinsel enfeksiyon ve HIV enfeksiyonu gibi kümülatif olduğunda, tamamlayıcı log-log bağlantısı ideal bir GLM spesifikasyonudur. jstor.org/stable/2532454
AdamO

2
@Alexis, eğrileri kaplarsanız yapışkan noktaları görebilirsiniz. curve(exp(-exp(x)), from=-5, to=5)Vs deneyin curve(plogis(x), from=-5, to=5). İçbükeylik hızlanır. Tek bir karşılaşmadan gelen olay riski p , ikinci olaydan sonraki risk 1(1p)2 vb. Olmalıdır, bu olasılıklı bir şekil logitinin yakalanmayacağı anlamına gelir. Yüksek yüksek maruziyetler, lojistik regresyon sonuçlarını daha dramatik bir şekilde çarpıtır (önceki olasılık kuralına göre yanlış). Bazı simülasyonlar bunu gösterecektir.
AdamO

1
@AdamO Muhtemelen böyle bir simülasyonu içeren yazılması gereken bir pedagojik makale var, bu da üçten belirli bir ikilik sonuç bağlantısının nasıl seçileceğini ve fark yaratmadığı durumlar da dahil olmak üzere nasıl seçileceğini motive ediyor.
Alexis

Yanıtlar:


27

Sadece denklemin her iki tarafının üstelini almanız gerekir ve bazı veriler için anlamlı olabilecek potansiyel bir ilişki elde edersiniz.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

Ve sadece herhangi bir pozitif değer alabilen bir parametre olduğundan, bu model aşağıdakilere eşdeğerdir:eb

Y=cXa

Model ifadesinin hata terimini içermesi gerektiği ve değişkenlerin bu değişikliğinin üzerinde ilginç etkileri olduğu belirtilmelidir:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

Yani, OLS koşullarına (normalde sabit varyanslı dağıtılmış hatalar) uyan bir ek hataya sahip modeliniz, logaritması sabit varyansla normal bir dağılımı takip eden çarpım hatalarına sahip potansiyel bir modele eşdeğerdir.


3
OP bu dağıtımın bir log adının normal olduğunu bilmek isteyebilir: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
Jensen eşitsizliğinin etkisi ne olacak? Genellikle dışbükey g için,E[g(X)]g(E[X])
İstatistikler

14

Eğer modeli alabilir : toplam diferansiyeli hesaplamak, gibi bir şey ile sona erecek hangi verimleri için log(Y)=alog(X)+b

1YdY=a1XdX
dYdXXY=a

Bu nedenle katsayısı basit yorumu yüzde değişim olacak bir yüzde değişiklik . Bu ayrıca değişkeninin büyüme hızının sabit bir fraksiyonunda ( ) büyüdüğünü gösterir .aYXYaX


Eğer log-log grafiği doğrusal ise, bu sabit bir büyüme oranı anlamına gelir mi?
Dimitriy V.Masterov

Aslında değil, büyüme hızı sadece ise sabit olacaktır . Ya=0
RScrlli

Zaman içinde değil, x cinsinden büyümeye göre büyüme oranı.
Dimitriy V. Masterov

yeniden sıralama yardımcı olmaz, kaldırırım
Aksakal

1
@ DimitriyV.Masterov Tamam, da lineer olduğu için değişkeni büyüme oranının sabit bir kısmında büyür . Sana göre cevabımda bir sorun mu var? log(Y)log(X)YX
RScrlli

7

Sezgisel olarak bize bir değişkenin büyüklük sırasını verir , bu nedenle iki değişkenin büyüklük sıraları doğrusal olarak ilişkili olduğu için ilişkiyi görebiliriz. Örneğin, yordayıcıyı bir büyüklük sırasına göre artırmak, yanıtın üç büyüklüğünde bir artışla ilişkilendirilebilir.log

Bir log-log grafiği kullanarak çizim yaparken doğrusal bir ilişki görmeyi umuyoruz. Bu sorudan bir örnek kullanarak , doğrusal model varsayımlarını kontrol edebiliriz:

log-log


3
Sezgisel olmayan bir kavrama sezgisel bir cevap için +1. Bununla birlikte, eklediğiniz görüntü, öngörücüdeki sabit hata varyansını açıkça ihlal eder.
Frans Rodenburg

1
Cevap doğru, ancak yazarlık ilişkilendirmesi yanlış. Resim, Google Görseller ile ilişkilendirilmemeli, en azından bulunacak web sayfasına yönlendirilmelidir; bu, yalnızca Google görselleri tıklanarak bulunabilir.
Pere

@ Resmin orijinal kaynağını maalesef bulamıyorum (en azından ters resim aramasını kullanarak)
qwr

Başlangıçta diagramss.us sitesinden geliyor gibi görünüyor ve bu site kapalı ve sayfalarının çoğu ana sayfasından
Henry

4

Cevabı @Rscrill ile gerçek ayrık veriler arasında uzlaştırma, düşünün

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

Fakat

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1 , ve dönemleri arasındaki değişim yüzdesi veya büyüme oranıdır , örneğin . küçük olduğunda , kabul edilebilir bir yaklaşımınYt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

Bu nedenle

gYtagXt

ampirik çalışmalarda @Rscrill'in teorik tedavisini doğrular.


1
Muhtemelen bir matematikçi sezgisel olarak adlandırır :)
Richard Hardy

2

Günlükler arasındaki doğrusal bir ilişki bir güç yasası bağımlılığına eşdeğerdir : Fizikte böyle bir davranış, sistemin ölçeksiz veya ölçek değişmez olduğu anlamına gelir . Bir örnek olarak, mesafe ve zaman bağımlılığı bu aracı olup , bir karakteristik uzunluk veya zaman ölçeği ile karakterize edilemez (üstel bozunur karşı). Bunun bir sonucu olarak, bu tür bir sistem bir uzun menzilli bağımlılık sergiler ile .

YXα
XXYX

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.