XGBoost, tahmin aşamasında eksik verileri işleyebilir


12

Son zamanlarda XGBoost algoritmasını gözden geçirdim ve bu algoritmanın eğitim aşamasında eksik verileri (çarpışma gerektirmeden) işleyebildiğini fark ettim. XGboost'un yeni gözlemleri tahmin etmek için kullanıldığında (eksik veri gerektirmeden) eksik veriyi işleyip işleyemeyeceğini veya eksik verileri etkilemek için gerekli olup olmadığını merak ediyordum.

Şimdiden teşekkürler.

Yanıtlar:


14

xgboost, eğitim sırasında eksik değerlerin sağ veya sol düğüme girip girmediğine karar verir. Hangisinin kaybı en aza indireceğini seçer. Egzersiz sırasında eksik değerler yoksa, varsayılan olarak doğru düğüme yeni eksik gönderir.

Eksiklerinizin dağıtımında sinyal varsa, bu esas olarak modele uygundur.

Puanlama verilerinizde eksik değerler egzersiz verilerinizden farklı dağıtılmışsa dikkatli olun. xgboost'un eksik kullanımı uygundur, ancak maskelemeye karşı koruma sağlamaz.

Kaynak: bu cevap

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.