Birincisi, aşağıdaki şekilde “yorumlanabilir”: bir tahmininiz, mevcut modelinizde önemliyse, o tahminde rastgele ancak 'gerçekçi' olarak (bu tahminin değerlerinin veri setiniz üzerinde olmasına izin vermek), negatif bir etkiye sahip olması gerekir. tahmin üzerine, yani: bir değişkeni hariç aynı olan verileri tahmin etmek için aynı modeli kullanmak, daha kötü tahminler vermelidir.
Bu nedenle, orijinal veri kümesiyle ve ardından 'izinli' veri kümesiyle öngörülü bir önlem (MSE) alırsınız ve bunları bir şekilde karşılaştırırsınız. Bir yol, özellikle orijinal MSE'nin daima daha küçük olmasını beklediğimizden, fark alınabilir. Son olarak, değerleri değişkenlerle karşılaştırılabilir kılmak için bunlar ölçeklendirilir.
İkincisi için: Her bölmede, bu bölmenin düğüm kirliliğini ne kadar azalttığını hesaplayabilirsiniz (regresyon ağaçları için, aslında, bölmeden önce ve sonra RSS arasındaki farkı). Bu, bu değişken için tüm ağaçların, tüm ağaçların üzerinde toplanır.
Not: İyi bir okuma, Hastie, Tibshirani ve Friedman'ın İstatistiksel Öğrenme Öğeleridir ...
?importance
mı Her iki önlemin ne anlama