Diyelim ki aşağıdaki verilerim var ve bir regresyon modeli kullanıyorum:
df=data.frame(income=c(5,3,47,8,6,5),
won=c(0,0,1,1,1,0),
age=c(18,18,23,50,19,39),
home=c(0,0,1,0,0,1))
Bir yandan, geliri tahmin etmek için doğrusal bir model çalıştırıyorum:
md1 = lm(income ~ age + home + home, data=df)
İkinci olarak, kazanılan değişkeni tahmin etmek için bir logit modeli çalıştırıyorum:
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
Her iki model için de, tahmin yanıt kategorisi, uygun değer ve model tahmin değeri ile nasıl bir tablo veya veri çerçevesi oluşturabileceğimi merak ediyorum.
Doğrusal model için şöyle bir şey:
age fitted_income predicted_income
18 3 5
23 3 3
50 4 2
19 5 5
39 6 4
home fitted_income predicted_income
0 5 6
1 3 9
Ya da belki de her veri noktası için olmalıdır. Yani x_i veri noktası için, takılmış ve tahmin edilen değerler şunlardır:
id age fitted_income predicted_income
1 18 3 5
2 23 3 3
3 50 4 2
4 19 5 5
5 39 6 4
İstatistiksel açıdan bakıldığında, böyle bir girişim faydalı mıdır? Neden ya da neden olmasın?
Bu, R'de nasıl yapılabilir? (isimlere (md1) baktı ve modelden neler çekebileceğimi buldum, ancak bunu geçemedim)
Teşekkürler!
residuals
komut içinde R
. cbind
Bunları orijinal veri çerçevesine birleştirmek için kullanın .