Rastgele Ormanların inşa edilme şekli, bağımsız değişkenlerin monotonik dönüşümlerine değişmez. Bölmeler tamamen benzer olacaktır. Eğer sadece doğruluk hedefliyorsanız, herhangi bir gelişme görmezsiniz. Aslında, Rastgele Ormanlar karmaşık doğrusal olmayan (Neden bu doğrusal regresyon diyorsunuz?) İlişkileri ve değişken etkileşimleri anında bulabildiğinden, bağımsız değişkenlerinizi dönüştürürseniz, bu algoritmanın yapmasına izin veren bilgileri düzeltebilirsiniz. bu düzgün.
Bazen Rastgele Ormanlar kara bir kutu olarak ele alınmaz ve çıkarsama için kullanılır. Örneğin, sağladığı değişken önem ölçülerini yorumlayabilir veya bağımsız değişkeninizin bağımlı değişkeniniz üzerindeki marjinal etkilerini hesaplayabilirsiniz. Bu genellikle kısmi bağımlılık grafikleri olarak görülür. Bu son şeyin değişkenlerin ölçeğinden oldukça etkilendiğinden eminim, bu da Rasgele Ormanlardan daha açıklayıcı bir doğa hakkında bilgi edinmeye çalışırken bir sorundur. Bu durumda, kısmi bağımlılık grafiklerini karşılaştırılabilir hale getirebilecek değişkenlerinizi dönüştürmenize (standartlaştırmanıza) yardımcı olabilir. Bundan tam olarak emin değilim, düşünmek zorunda kalacak.
Çok geçmeden Rastgele Orman kullanarak sayım verilerini tahmin etmeye çalıştım, karekök ve bağımlı değişkenin doğal günlüğü gerileyerek biraz yardımcı oldu ve modeli tutmama izin vermedi.
Çıkarım yapmak için rastgele ormanları kullanabileceğiniz bazı paketler:
https://uc-r.github.io/lime
https://cran.r-project.org/web/packages/randomForestExplainer/index.html
https://pbiecek.github.io/DALEX_docs/2-2-useCaseApartmetns.html