RandomForest'i 6 hayvan davranışını (örneğin Ayakta, Yürüme, Yüzme vb.) 8 değişkene (farklı vücut duruşları ve hareket) göre sınıflandırmak için kullandım.
RandomForest paketindeki MDSplot bana bu çıktıyı verir ve sonucu yorumlamada sorun yaşıyorum. Aynı veriler üzerinde bir PCA yaptım ve zaten PC1 ve PC2'deki tüm sınıflar arasında güzel bir ayrım yaptım, ancak burada Dim1 ve Dim2 sadece 3 davranışı ayırıyor gibi görünüyor. Bu, bu üç davranışın diğer tüm davranışlardan daha farklı olduğu anlamına mı gelir (bu nedenle MDS, değişkenler arasındaki en büyük farklılığı bulmaya çalışır, ancak ilk adımdaki tüm değişkenleri mutlaka içermez)? Üç kümenin (ör. Dim1 ve Dim2'de olduğu gibi) konumlandırılması neyi gösterir? RI için oldukça yeni olduğum için de bu arsaya bir efsane çizmekte sorun yaşıyorum (ancak farklı renklerin ne anlama geldiğine dair bir fikrim var), ama belki biri yardımcı olabilir mi? Çok teşekkürler!!
RandomForest ClassCenter işlevi ile yapılan bir arsa ekleyin. Bu işlev, prototipleri çizmek için yakınlık matrisini (MDS Grafiğindeki ile aynı) kullanır. Ancak sadece altı farklı davranışın veri noktalarına bakarak, yakınlık matrisinin prototiplerimi neden olduğu gibi çizeceğini anlayamıyorum. Ayrıca iris verileri ile classcenter fonksiyonunu denedim ve çalışıyor. Ama verilerim için işe yaramıyor gibi görünüyor ...
İşte bu arsa için kullandığım kod
be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))
Sınıf sütunum ilk, ardından 8 öngörücüdür. En iyi tahmin değişkenlerinden ikisini x ve y olarak çizdim.