İlişkileri çoklu doğrusal modelden görsel olarak sunmanın en iyi yolu


15

Yaklaşık 6 öngörücü içeren doğrusal bir modelim var ve tahminler, F değerleri, p değerleri vb. cevap değişkeni? Dağılım grafiği? Koşullu Arsa? Etkiler arsa? vb? Bu komployu nasıl yorumlayabilirim?

Bunu R'de yapacağım, bu yüzden mümkünse örnekler vermekten çekinmeyin.

EDIT: Ben öncelikle herhangi bir öngörücü ve yanıt değişkeni arasındaki ilişkiyi sunmakla ilgileniyorum.


Etkileşim terimleriniz var mı? Eğer onları çizmek çok daha zor olurdu.
Hotaka

Hayır, sadece 6 sürekli değişken
AMathew

Halihazırda tablo biçiminde sunulacak olan her bir tahminci için bir tane olmak üzere altı regresyon katsayınız var, aynı noktayı tekrar grafikle tekrarlamanın nedeni nedir?
Penguin_Knight

3
Teknik olmayan kitleler için, onlara tahmin veya katsayıların nasıl hesaplandığı hakkında konuşmaktan ziyade bir çizim göstermek isterim.
AMAThew

2
@tony, anlıyorum. Belki de bu iki web sitesi size ilham verebilir: regresyon modellerini görselleştirmek için R visreg paketi ve hata çubuğu grafiği kullanmak.
Penguin_Knight

Yanıtlar:


12

Benim düşünceme göre, tanımladığınız model, çizimleri tam olarak ödünç vermez, çünkü grafikler, aksi takdirde anlaşılması zor karmaşık bilgileri (ör., Karmaşık etkileşimler) gösterdiklerinde en iyi şekilde çalışırlar. Ancak, modelinizdeki ilişkilerin bir grafiğini görüntülemek istiyorsanız, iki ana seçeneğiniz vardır:

  1. Ham veri noktalarının bir dağılım grafiğiyle, her bir ilgili belirleyiciniz ve sonucunuz arasındaki iki değişkenli ilişkilerin bir dizi grafiğini görüntüleyin. Hata zarflarını satırlarınızın çevresine çizin.
  2. Seçenek 1'deki grafiği görüntüleyin, ancak ham veri noktalarını göstermek yerine, veri noktalarını marjinal hale getirilmiş diğer öngörücülerinizle gösterin (yani, diğer tahmincilerin katkılarını çıkardıktan sonra)

Seçenek 1'in yararı, izleyicinin ham verilerdeki saçılımı değerlendirmesine izin vermesidir. Seçenek 2'nin yararı, görüntülemekte olduğunuz odak katsayısının standart hatasıyla sonuçlanan gözlem düzeyi hatasını göstermesidir.

R kodunu ve R'deki paketteki Prestigeveri kümesinden verileri kullanarak aşağıdaki her seçeneğin bir grafiğini ekledim.car

## Raw data ##

mod <- lm(income ~ education + women, data = Prestige)
summary(mod)

# Create a scatterplot of education against income
plot(Prestige$education, Prestige$income, xlab = "Years of education", 
     ylab = "Occupational income", bty = "n", pch = 16, col = "grey")
# Create a dataframe representing the values on the predictors for which we 
# want predictions
pX <- expand.grid(education = seq(min(Prestige$education), max(Prestige$education), by = .1), 
                  women = mean(Prestige$women))
# Get predicted values
pY <- predict(mod, pX, se.fit = T)

lines(pX$education, pY$fit, lwd = 2) # Prediction line
lines(pX$education, pY$fit - pY$se.fit) # -1 SE
lines(pX$education, pY$fit + pY$se.fit) # +1 SE

Ham veri noktalarını kullanan grafik

## Adjusted (marginalized) data ##

mod <- lm(income ~ education + women, data = Prestige)
summary(mod)

# Calculate the values of income, marginalizing out the effect of percentage women
margin_income <- coef(mod)["(Intercept)"] + coef(mod)["education"] * Prestige$education + 
    coef(mod)["women"] * mean(Prestige$women) + residuals(mod)

# Create a scatterplot of education against income
plot(Prestige$education, margin_income, xlab = "Years of education", 
     ylab = "Adjusted income", bty = "n", pch = 16, col = "grey")
# Create a dataframe representing the values on the predictors for which we 
# want predictions
pX <- expand.grid(education = seq(min(Prestige$education), max(Prestige$education), by = .1), 
              women = mean(Prestige$women))
# Get predicted values
pY <- predict(mod, pX, se.fit = T)

lines(pX$education, pY$fit, lwd = 2) # Prediction line
lines(pX$education, pY$fit - pY$se.fit) # -1 SE
lines(pX$education, pY$fit + pY$se.fit) # +1 SE

Düzeltilmiş veriler

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.