Partiye geç, ama yine de benim cevabım ve "Evet" dir, model / yöntemin doğrusal ya da doğrusal olmasından ya da ana görevin tahmin ya da sınıflandırmadan bağımsız olarak her zaman eş-doğruluktan endişelenmesi gerekir.
Yöntem olarak veri kümesinde ve Rastgele Orman'da bulunan bir dizi doğrusal olarak ilişkili ortak değişken / özellik olduğunu varsayalım. Açıkçası, düğüm başına rastgele seçim sadece (veya çoğunlukla) zayıf bir bölünme ile sonuçlanabilecek / sonuçlanacak olan eşdoğrusal özellikleri seçebilir ve bu tekrar tekrar gerçekleşebilir, dolayısıyla performansı olumsuz yönde etkileyebilir.
Şimdi, eşdoğrusal özellikler, diğer (eş-doğrusal olmayan) özelliklerden daha az sonuç verici olabilir ve bu nedenle, yine de özellik kümesinden elenmesi için düşünülmelidir. Bununla birlikte, RF tarafından üretilen 'özellik önemi' listesinde özelliklerin üst sıralarda yer aldığını varsayın. Bu nedenle, boyutsallığı arttırarak gereksiz yere veri kümesinde tutulacaklardır. Yani, pratikte, her zaman, keşifsel bir adım olarak (birçok ilgili olandan) doğrusal korelasyon da dahil olmak üzere özelliklerin ikili ilişkisini kontrol ederdim.