Kullanarak modelleri seçmek istiyorum regsubsets()
. Olympiadaten adlı bir veri çerçevem var (yüklenen veriler: http://www.sendspace.com/file/8e27d0 ). Önce bu veri çerçevesini ekleyin ve sonra analiz etmeye başlar, benim kod:
attach(olympiadaten)
library(leaps)
a<-regsubsets(Gesamt ~ CommunistSocialist + CountrySize + GNI + Lifeexp +
Schoolyears + ExpMilitary + Mortality +
PopPoverty + PopTotal + ExpEdu + ExpHealth, data=olympiadaten, nbest=2)
summary(a)
plot(a,scale="adjr2")
summary(lm(Gesamt~ExpHealth))
arsanın ekran görüntüsü:
Sorun şimdi, en iyi modeli tekrar "manuel" sığdırmak ve ona bir göz atmak istiyorum, ama ayarlanmış R kare değeri regsubsets çıktı ile aynı değil mi? Bu, örneğin grafikteki en basit modeli yaptığımda diğer modeller için de geçerlidir:
summary(lm(Gesamt~ExpHealth))
Grafik, yaklaşık 0.14'lük bir R kare ayarına sahip olması gerektiğini söylüyor, ancak çıktıya baktığımda 0.06435 değeri alıyorum.
İşte çıktı summary(lm(Gesamt~ExpHealth))
:
Call:
lm(formula = Gesamt ~ ExpHealth)
Residuals:
Min 1Q Median 3Q Max
-18.686 -9.856 -4.496 1.434 81.980
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.0681 6.1683 -0.497 0.6203
ExpHealth 1.9903 0.7805 2.550 0.0127 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 18.71 on 79 degrees of freedom
(4 observations deleted due to missingness)
Multiple R-squared: 0.07605, Adjusted R-squared: 0.06435
F-statistic: 6.502 on 1 and 79 DF, p-value: 0.01271
Neyi yanlış yapmış olabileceğimi bilmiyorum, herhangi bir yardım takdir edilecektir.
Ve son olarak, en önemlisi, bazı sorular:
- AIC ve adj. Tarafından modelleri seçmek arasındaki fark nedir? R kare mi?
- Her ikisi de uyumu ölçer ve değişken sayısını tanır, bu nedenle AIC tarafından seçilen en iyi model değil, aynı zamanda en yüksek adj. r kare?
- 12 değişkenim olduğunda, bu , modellerin olasılığı olduğu anlamına gelir , değil mi?
- Yani gelmez
regsubsets()
komut her modeli hesaplamak ve en iyi iki (göstermeknbest=2
her boyutta)? - Eğer öyleyse, gerçekten 'en iyi' modeli alabilir miyim?
- Ve geriye doğru seçim (tüm değişkenleri içeren model ile başlayan) kullanarak AIC yaptığımda, bu da
regsubsets()
en iyi olduğunu söyleyen aynı model ile sonuçlanır ?