Paket vif()
yöntemini kullanarak car
, bir modeldeki girdilerin çok doğrusallık derecesini hesaplayabileceğimizi öğrendim . Gönderen wikipedia eğer vif
değer büyükse 5
o zaman giriş çoklu bağlantı problemi yaşayan olduğunu düşünebilirsiniz. Örneğin, lm()
yöntemi kullanarak doğrusal bir regresyon modeli geliştirdim ve vif()
aşağıdaki gibi verir. Gördüğümüz gibi, girişler ub
, lb
ve tb
çoklu doğrusal yaşıyorlar.
vif(lrmodel)
tb ub lb ma ua mb sa sb
7.929757 50.406318 30.826721 1.178124 1.891218 1.364020 2.113797 2.357946
Benim modeli daha sağlam hale getirmek için bu şekilde çoklu bağlantı sorunu önlemek ve amacıyla, ben arasındaki etkileşimi almış ub
ve lb
ve şimdi yeni modelin tablo aşağıdaki gibidir vif:
tb ub:lb ma mb sa sb ua
1.763331 1.407963 1.178124 1.327287 2.113797 1.860894 1.891218
R^2
Yukarıdaki her iki durumda da değerler arasında bir fark yoktur ve tek bir bırakma CV testlerinden kaynaklanan hatalar arasında çok fazla fark yoktur.
Sorularım:
Yukarıda gösterildiği gibi etkileşimi alarak çoklu bağlantı probleminden kaçınmak iyi midir?
Yukarıdaki vif yöntemi sonuçlarına kıyasla çoklu-doğrusallık problemini göstermenin daha iyi bir yolu var mı?
Lütfen bana önerilerinizi verin.
Teşekkürler.