Henüz tahmin etmek için veri tutmayı denemedim, ancak sezgim, modelinizde kovaryansları sıfıra sabitlemenin, bir dizi ayrı, tek IV, doğrusal regresyon denklemini birleştirerek bir DV'yi tahmin etmeye benzer olmasıdır. Bu yaklaşımın aksine, çoklu regresyon, DV'yi tahmin etmek için bir denklemler modeli üretirken IV'lerde kovaryansı açıklar. Bu, doğrudan efektleri, dahil edilen IV seti içinde meydana gelen dolaylı etkilerden ayırarak kesinlikle yorumlanabilirliği geliştirir. Dürüst olmak gerekirse, bunun DV tahminini mutlaka artırıp iyileştirmediğinden emin değilim. Bir istatistik kullanıcısı değil, istatistik kullanıcısı olarak, bu simülasyona benzer durumda eksik bir cevap vermek için (görünüşte, "Evet, model IV kovaryans içerdiğinde tahmin doğruluğu artar") aşağıdaki simülasyon testi işlevini bir araya getirdim ...
simtestit=function(Sample.Size=100,Iterations=1000,IV.r=.3,DV.x.r=.4,DV.z.r=.4) {
require(psych); output=matrix(NA,nrow=Iterations,ncol=6); for(i in 1:Iterations) {
x=rnorm(Sample.Size); z=rnorm(Sample.Size)+x*IV.r
y=rnorm(Sample.Size)+x*DV.x.r+z*DV.z.r
y.predicted=x*lm(y~x+z)$coefficients[2]+z*lm(y~x+z)$coefficients[3]
bizarro.y.predicted=x*lm(y~x)$coefficients[2]+z*lm(y~z)$coefficients[2]
output[i,]=c(cor(y.predicted,y)^2,cor(bizarro.y.predicted,y)^2,
cor(y.predicted,y)^2>cor(bizarro.y.predicted,y)^2,cor(x,z),cor(x,y),cor(y,z))}
list(output=output,percent.of.predictions.improved=100*sum(output[,3])/Iterations,
mean.improvement=fisherz2r(mean(fisherz(output[,1])-fisherz(output[,2]))))}
# Wrapping the function in str( ) gives you the gist without filling your whole screen
str(simtestit())
N-= Iterations
nSample.Size
z
= x
+y
= x
+ z
+y
x
z
1y.predicted
2bizarro.y.predicted
output
Iterations
R2121>2rx
y
z
output
simtestit()
str( )
R21rpsych
R,2R,2IV.r
) daha büyüktür. Muhtemelen GLM işlevinize benden daha aşina olduğunuzdan (ki bu hiç de değil), muhtemelen bu işlevi değiştirebilir veya çok fazla sorun olmadan istediğiniz IV'lerde GLM tahminlerini karşılaştırmak için temel fikri kullanabilirsiniz. Bunun aynı şekilde ortaya çıkacağı (veya çıktığı) varsayarsak, ikinci sorunuzun temel cevabı muhtemelen evet, ancak IV'lerin ne kadar güçlü bir şekilde değiştiğine bağlı gibi görünüyor. Bekletilen veriler ile modele sığdırmak için kullanılan veriler arasındaki örnekleme hatası farkları, ikinci veri kümesindeki öngörme doğruluğundaki iyileşmeyi ezebilir, çünkü yine IV korelasyonları güçlü olmadıkça (en azından, sadece iki IV ile maksimum temel vaka).