Değişken önem rasgeleOrman negatif değerler


10

Kendime, bir negatif değişken önem değerine ("% IncMSE") sahip olan bu değişkenleri bir regresyon bağlamında kaldırmanın iyi bir fikir olup olmadığını soruyorum. Ve bana daha iyi bir tahmin verirse? Ne düşünüyorsun?

Yanıtlar:


5

Rastgele ormandaki değişken önem şu şekilde hesaplanır:

  1. Başlangıçta, modelin MSE'si orijinal değişkenlerle hesaplanır
  2. Daha sonra, tek bir sütunun değerlerine izin verilir ve MSE tekrar hesaplanır. Örneğin, bir sütun (Col1) 1,2,3,4 değerlerini alırsa ve değerlerin rastgele permütasyonu 4,3,1,2 ile sonuçlanır. Bu bir MSE1 ile sonuçlanır. Daha sonra MSE'deki bir artış, yani MSE1 - MSE, değişkenin önemini gösterir.

  3. Farkın pozitif olmasını bekliyoruz, ancak negatif bir sayı söz konusu olduğunda, rastgele permütasyonun daha iyi çalıştığını gösterir. Değişkenin tahminde bir rolü olmadığı, yani önemli olmadığı anlaşılabilir.

Bu yardımcı olur umarım!

Ayrıntılı bir açıklama için lütfen aşağıdaki bağlantıya bakın!

/programming/27918320/what-does-negative-incmse-in-randomforest-package-mean


3

Bu sadece rastgele bir dalgalanma olabilir (örneğin küçük ntree'niz varsa).

Değilse, verilerinizde ciddi miktarda paradoksunuz olduğunu gösterebilir, yani neredeyse aynı öngörücülere ve çok farklı sonuçlara sahip nesne çiftleri. Bu durumda, modelin gerçekten bir anlam ifade edip etmediğini iki kez kontrol edip bunları çözmek için nasıl daha fazla nitelik alabileceğimi düşünmeye başlarım.


2
"Verilerdeki paradokslar" üzerinde biraz daha ayrıntılı olarak durur musunuz? Ben tam olarak takip etmedim ve ne anlattığınızı anlamak istiyorum.
JEquihua
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.