RandomForestRegressor için çanta dışı hata tahminini yorumlama


9

Verilerimde RandomForest regresörü kullanıyorum ve oob skorunun 0.83 olarak elde edildiğini görebiliyordum. Böyle olmanın nasıl bir şey olduğu konusunda emin değilim. Yani hedeflerim 10 ^ 7 aralığında yüksek değerler. Eğer MSE ise, o zaman çok daha yüksek olmalıydı. Burada 0.83'ün ne anlama geldiğini anlamıyorum.

Sklearn araç setinin python'un RandomForestRegressor'unu kullanıyorum.

Yaparım

model = RandomForestRegressor (max_depth = 7, n_estimators = 100, oob_score = Doğru, n_jobs = -1) model.fit (trainX, trainY)

Sonra model.oob_score_'u görüyorum ve 0.83809026152005295 gibi değerler alıyorum


@Momo. Python'un sklearn.ensemble's RandomForestRegressor'unu kullanıyorum. Sadece modeli kullanıyorum
user34790

Yanıtlar:


6

Temel gerçek (yani doğru / gerçek) hedef değerlerini rastgele orman tarafından tahmin edilen (yani tahmin edilen) hedef değerlerle karşılaştırmak için scikit-learn MSE kullanmaz, R,2(örneğin MATLAB veya ( Breiman 1996b ) gibi), forest.py kodunda görebileceğiniz gibi :

self.oob_score_ = 0.0
for k in xrange(self.n_outputs_):
    self.oob_score_ += r2_score(y[:, k], predictions[:, k])
self.oob_score_ /= self.n_outputs_

r2_score()aka belirleme katsayısını hesaplar . En iyi puanı 1.0 olan R2 ve daha düşük değerler daha kötüdür.

Bilginize:

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.