I ağaçların sayısını artırmak gibi scikit öğrenmek 's GradientBoostingRegressor
, ben hiçbir negatif değerler benim eğitim veya set test bulunmasına rağmen, daha olumsuz tahminler alabilirsiniz. Çoğu ikili olan yaklaşık 10 özelliğim var.
Ayarladığım parametrelerden bazıları:
- ağaç / yineleme sayısı;
- öğrenme derinliği;
- ve öğrenme oranı.
Negatif değerlerin yüzdesi ~% 2'de maks. 1 (kütükler) öğrenme derinliği negatif değerlerin en büyük% 'sine sahip gibi görünüyordu. Bu yüzde, daha fazla ağaç ve daha küçük bir öğrenme oranı ile arttı. Veri seti, kaggle oyun alanı yarışmalarından biridir.
Kodum şöyle bir şeydir:
from sklearn.ensemble import GradientBoostingRegressor
X_train, X_test, y_train, y_test = train_test_split(X, y)
reg = GradientBoostingRegressor(n_estimators=8000, max_depth=1, loss = 'ls', learning_rate = .01)
reg.fit(X_train, y_train)
ypred = reg.predict(X_test)