Bir nomogram okumaya ilişkin açıklamalar


10

Formül için rms paketi ile mtcars veri kümesinden oluşturulan bir nomogram aşağıdadır:

mpg ~ wt + am + qsec

resim açıklamasını buraya girin

Modelin kendisi 0.85 R2 ve P <0.00001 ile iyi görünüyor

> mod

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

Bu 'Puanlar', 'Toplam Puanlar' ve 'Doğrusal Öngörücü' ne olduğu net değil. Bunlardan hangisi sonuç değişkeni mpg'yi temsil eder? Herhangi bir açıklamayı takdir edeceğim.

Düzenleme: noktaların vb. Kolay okunması için @Glen_b tarafından mükemmel önerileri dikkate alarak, aşağıdaki alternatif bir nomogram olabilir:

resim açıklamasını buraya girin

Sonuç veya yanıt değişkeni mevcut olduğundan, 'Doğrusal Predictor' terimi yerine kullanılabilir. Ayrıca, nomogramın nasıl okunması gerektiğine dair açıklayıcı hale gelir.


orada düzenleme güzel diyagramı
Glen_b-Monica Monica

Yanıtlar:


11

Peki, modeliniz doğrusal olduğundan, beklenen mpg doğrusal öngörücüye eşit olduğundan, mpg'yi doğrusal öngörücü ölçeğinden hemen okuyabilirsiniz.

Her değişken için değerini ilgili ölçekte bulabilirsiniz. Örneğin, aşağıdakilere sahip bir araba için tahmini bir mpg bulmak istediğimizi düşünün wt=4, am=1, qsec=18:

resim açıklamasını buraya girin

bu da yaklaşık 18.94'lük bir tahmini mpg verir. Denklemin yerine geçmesi 18,95 verir, bu oldukça yakındır. (Uygulamada muhtemelen en yakın noktaya kadar çalışacaksınız - ve burada olduğu gibi 3-4 rakam yerine yaklaşık 2 rakam doğruluğu - "19 mpg" - elde edersiniz.)

Böyle bir diyagramın aklıma gelen başlıca faydalarından biri, farklı öngörücü değişkenlerdeki (IV) değişikliklerin tepki (DV) üzerindeki göreceli etkisini anında görmenizdir. Herhangi bir hesaplama için diyagrama ihtiyacınız olmasa bile, değişkenlerin göreli etkilerini gösterme açısından büyük bir değere sahip olabilir.


Yorumlardan gelen takip sorusu:

Doğrusal olmayan veya polinom regresyonları için aynı şekilde çalışır mı?

Aşağıdaki durumlarda E(Y)bazı öngörücülerde doğrusal değildir, bazı küçük ve belki de açık değişikliklere ihtiyaç vardır. Sahip olduğumuzu hayal ety^=b0+bx1+f(x2)

burada:

(A) fmonotoniktir; veya

(B) folduğu değil monoton

Her iki durumda da, x1 tam olarak yukarıdaki gibi çalışır, ancak şu durumlarda:

(a) için ölçek x2doğrusal olmayacak; örneğin,f monotonik azalıyor, ancak (kabaca) ikinci dereceden, böyle bir şeye sahip olabilirsiniz:

resim açıklamasını buraya girin

(b) için monotonik olmayan ölçek x2bir dönüm noktasında "kırılacak" ve ters dönecektir. Örneğin

resim açıklamasını buraya girin

- burada fonksiyon f(x) etrafında bir yerde minimum x=2.23

Bu tür işlevlerin, ölçeklerin birden çok kez kırılıp ters döneceği birkaç dönüş noktasına sahip olması mümkündür - ancak eksen çizgisinin sadece iki tarafı vardır.

Nokta tipi nomogramlarda bu herhangi bir zorluk yaratmaz, çünkü herhangi bir çakışma oluşana kadar ek ölçek bölümleri yukarı veya aşağı (veya daha genel olarak, eksen yönüne dik olarak) hareket ettirilebilir.

(Birden fazla dönüm noktası, hizalama tipi nomogramlar için bir sorun olabilir; Harrell'in kitabında gösterilen bir çözüm, değerin konumunun gerçekte alındığı bir referans çizgisinden tüm ölçekleri hafifçe dengelemektir.)


Doğrusal olmayan bağlantı fonksiyonuna sahip GLM'lerde, ölçekler yukarıdaki gibi çalışır, ancak doğrusal kestiricinin ölçeği doğrusal olmayan bir ölçekle işaretlenir .Y, yukarıdaki (a) gibi bir şey.

Tüm bu durumlara örnekler Harrell'in Regresyon Modelleme Stratejilerinde bulunabilir .



Sadece birkaç yan not

  1. İlgili bölümün üstünde ve altında iki nokta ölçeği görmeyi tercih ederim ; aksi takdirde 'dikey' olanın ne olduğunu tahmin etmek zorunda olduğunuz için doğru bir şekilde "sıralamak" zordur. Bunun gibi bir şey:

    resim açıklamasını buraya girin

    Bununla birlikte, yorumlarda belirttiğim gibi, diyagramın son bölümü için (toplam noktalar ve doğrusal öngörücü) belki de ikinci bir puan ölçeğine daha iyi bir alternatif, bir çift sırt sırta ölçeklere sahip olmak olacaktır (birindeki toplam puanlar) (diğer tarafta doğrusal öngörücü), şöyle:

    resim açıklamasını buraya girin

    bunun üzerine “dikey” in ne olduğunu bilmemize gerek kalmıyor.

  2. Sadece iki sürekli öngörücü ve tek bir ikili faktörle, daha geleneksel bir hizalama nomogramı oluşturabiliriz :

    resim açıklamasını buraya girin

    Bu durumda sadece bulmak wtve qseconların ölçeklerde değer ve bir çizgiyle onlara katılmak; mpgekseni geçtiklerinde , değeri okuruz ( amdeğişken, mpgeksenin hangi tarafını okuduğunuzu belirler). Bunun gibi basit bir durumda, bu tür nomogramların kullanımı daha hızlı ve daha basittir, ancak birçok tahmin ediciyi genelleştirmek daha kolay olmayabilir. Sorunuzdaki puan stili nomogramı ( Regresyon Modelleme Stratejileri'nde ve rmsR'deki pakette uygulandığı gibi ) daha fazla değişkeni sorunsuz bir şekilde ekleyebilir. Etkileşimlerle uğraşırken bu oldukça avantajlı olabilir.


Açık ve resimli bir açıklama için teşekkürler. Doğrusal olmayan veya polinom regresyonları için aynı şekilde çalışır mı?
rnso

1
Bu ek soruya yanıt vermek için cevabımı düzenledim.
Glen_b

2
Bu inanılmaz bir yazı Glen. Varsayılan olarak ekstra ölçek eklemek için nomogramişlevin plotyöntemini değiştireceğim düşünüyorum Points. Büyük öneri !!
Frank Harrell

1
@FrankHarrell Hayır, çünkü puanlar ve toplam puanlar arasında herhangi bir ilişki okumuyorsunuz - aynı sayfada olmaları bile gerekmiyor. Sorun 'dikey' bulmaktır, böylece toplam noktalardan lineer öngörücüye doğru bir şekilde okuyabilirsiniz. Eğer bu iki ölçek birbirinden iki inç uzaklık yerine çok yakın veya dokunaklıysa, bu bir sorun değildir. İnç aralarında olduklarında, dikey bulmada birkaç derece hata, sonuçta oldukça fazla hata anlamına gelebilir. Yine de ilk bölümde iki puan ölçeğine ihtiyacınız var, çünkü birçok tahminciniz olabilir ve hepsi puan ölçeğine bitişik olamaz.
Glen_b-Monica

1
@FrankHarrell Şahsen bir ızgara görüntüyü tıkar ve değerini gizler; Yapabildiğimde ızgaralardan kaçınırım. Ayrıca ızgara ölçeği kadar ince olmadığı sürece dikey olarak aynı hassasiyet derecesine izin vermiyorlar (ki görsel olarak korkunç olacağını düşünüyorum), biri için bir seçenek olmadan, ikinci bir puan ölçeğinde düzenleme yapardım (tıpkı burada yaptığım gibi) iki amaç için kullanılabilir bir durum olarak göreceğimi elde etmek için (i. tahmin edilen değerlerin örtülmeden makul değerleri doğru tahmin etmek ii) göreceli katkıların netliği yanıt) ..
Glen_b -Monica Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.