I ağaçların sayısını artırmak gibi scikit öğrenmek 's GradientBoostingRegressor, ben hiçbir negatif değerler benim eğitim veya set test bulunmasına rağmen, daha olumsuz tahminler alabilirsiniz. Çoğu ikili olan yaklaşık 10 özelliğim var.
Ayarladığım parametrelerden bazıları:
- ağaç / yineleme sayısı;
- öğrenme derinliği;
- ve öğrenme oranı.
Negatif değerlerin yüzdesi ~% 2'de maks. 1 (kütükler) öğrenme derinliği negatif değerlerin en büyük% 'sine sahip gibi görünüyordu. Bu yüzde, daha fazla ağaç ve daha küçük bir öğrenme oranı ile arttı. Veri seti, kaggle oyun alanı yarışmalarından biridir.
Kodum şöyle bir şeydir:
from sklearn.ensemble import GradientBoostingRegressor
X_train, X_test, y_train, y_test = train_test_split(X, y)
reg = GradientBoostingRegressor(n_estimators=8000, max_depth=1, loss = 'ls', learning_rate = .01)
reg.fit(X_train, y_train)
ypred = reg.predict(X_test)