Rpart (R) kullanarak bir CART modeli (özellikle sınıflandırma ağacı) oluştururken, modele tanıtılan çeşitli değişkenlerin önemini bilmek genellikle ilginçtir.
Dolayısıyla benim sorum şu: Bir CART modelinde katılımcı değişkenlerin değişken önem derecesini sıralamak / ölçmek için hangi ortak önlemler var? Ve bu nasıl R kullanılarak hesaplanabilir (örneğin, rpart paketini kullanırken)
Mesela, işte bazı kukla kod, yaratılmış, böylece çözümlerinizi gösterebilirsiniz. Bu örnek, x1 ve x2 değişkeninin "önemli" olduğu açıkken, (bazı anlamda) x1'in x2'den daha önemli olduğu açıktır (x1, daha fazla durumda geçerli olmalıdır, bu nedenle verilerin yapısı üzerinde daha fazla etki yapmalıdır. sonra x2).
set.seed(31431)
n <- 400
x1 <- rnorm(n)
x2 <- rnorm(n)
x3 <- rnorm(n)
x4 <- rnorm(n)
x5 <- rnorm(n)
X <- data.frame(x1,x2,x3,x4,x5)
y <- sample(letters[1:4], n, T)
y <- ifelse(X[,2] < -1 , "b", y)
y <- ifelse(X[,1] < 0 , "a", y)
require(rpart)
fit <- rpart(y~., X)
plot(fit); text(fit)
info.gain.rpart(fit) # your function - telling us on each variable how important it is
(referanslar her zaman memnuniyetle karşılanır)