Yanıtlar:
Rastgele ormandaki değişken önem şu şekilde hesaplanır:
Daha sonra, tek bir sütunun değerlerine izin verilir ve MSE tekrar hesaplanır. Örneğin, bir sütun (Col1) 1,2,3,4 değerlerini alırsa ve değerlerin rastgele permütasyonu 4,3,1,2 ile sonuçlanır. Bu bir MSE1 ile sonuçlanır. Daha sonra MSE'deki bir artış, yani MSE1 - MSE, değişkenin önemini gösterir.
Farkın pozitif olmasını bekliyoruz, ancak negatif bir sayı söz konusu olduğunda, rastgele permütasyonun daha iyi çalıştığını gösterir. Değişkenin tahminde bir rolü olmadığı, yani önemli olmadığı anlaşılabilir.
Bu yardımcı olur umarım!
Ayrıntılı bir açıklama için lütfen aşağıdaki bağlantıya bakın!
/programming/27918320/what-does-negative-incmse-in-randomforest-package-mean
Bu sadece rastgele bir dalgalanma olabilir (örneğin küçük ntree'niz varsa).
Değilse, verilerinizde ciddi miktarda paradoksunuz olduğunu gösterebilir, yani neredeyse aynı öngörücülere ve çok farklı sonuçlara sahip nesne çiftleri. Bu durumda, modelin gerçekten bir anlam ifade edip etmediğini iki kez kontrol edip bunları çözmek için nasıl daha fazla nitelik alabileceğimi düşünmeye başlarım.