Şimdiye kadar, korelasyon tablolarına bakarak ve belirli bir eşiğin üzerindeki değişkenleri kaldırarak veri hazırlama sürecinin bir parçası olarak eş doğrusal değişkenleri kaldırdım. Bunu yapmanın daha kabul edilmiş bir yolu var mı? Ayrıca, bir seferde sadece 2 değişken arasındaki korelasyona bakmanın ideal olmadığını biliyorum, VIF gibi ölçümler çeşitli değişkenler arasındaki potansiyel korelasyonu dikkate alıyor. Çoklu doğrusallık sergilemeyen değişken kombinasyonları sistematik olarak nasıl seçebiliriz?
Verilerimi panda veri çerçevesi içinde aldım ve sklearn modellerini kullanıyorum.