Küçük ama fark edilir çoklu bağlantı etkisi vardı çok değişkenli regresyon modelini düzeltmeye ederken, varyans enflasyon faktörler tarafından ölçülen ben fark dahilinde (tabii referans kategorisini hariç sonra) bir kategorik değişkenin kategorilerine.
Örneğin, sürekli değişkeni y olan bir veri setimiz ve karşılıklı olası münhasır değerleri k olan bir nominal kategorik x değişkeni olduğunu varsayalım. Bu olası değerleri 0/1 kukla değişkenleri . Sonra bir regresyon modeli çalıştırıyoruz . kukla değişkenleri için VIF skorları sıfırdan farklıdır. Aslında, kategori sayısı arttıkça, VIF'ler de artar. Sahte değişkenleri ortalamak VIF'leri değiştirmiyor gibi görünüyor.x 1 , x 2 , … , x k y = b 0 + b 1 x 1 + b 2 x 2 + ⋯ + b k - 1 k - 1
Sezgisel açıklama, kategorik değişken içindeki kategorilerin karşılıklı olarak münhasır koşulunun, bu hafif çoklu doğrusallığa neden olduğu görülmektedir. Bu önemsiz bir bulgu mu yoksa kategorik değişkenli regresyon modelleri oluştururken dikkate alınması gereken bir konu mu?