Bir xgboost modeli koştum. Çıktısını nasıl yorumlayacağımı tam olarak bilmiyorum xgb.importance
.
Kazanç, Kapak ve Frekansın anlamı nedir ve bunları nasıl yorumluyoruz?
Ayrıca, Split, RealCover ve RealCover% ne anlama geliyor? Burada bazı ekstra parametrelerim var
Özellik ithalatı hakkında daha fazla bilgi verebilecek başka parametreler var mı?
R belgelerine göre, Kazanç'ın Bilgi kazanımına benzer bir şey olduğunu ve Frekansın tüm ağaçlarda bir özelliğin kullanılma sayısı olduğunu anladım. Cover'ın ne olduğu hakkında hiçbir fikrim yok.
Bağlantıda verilen örnek kodu koştum (ve üzerinde çalıştığım problemde de aynı şeyi yapmaya çalıştım), ancak orada verilen ayırma tanımı hesapladığım sayılarla eşleşmedi.
importance_matrix
Çıktı:
Feature Gain Cover Frequence
1: xxx 2.276101e-01 0.0618490331 1.913283e-02
2: xxxx 2.047495e-01 0.1337406946 1.373710e-01
3: xxxx 1.239551e-01 0.1032614896 1.319798e-01
4: xxxx 6.269780e-02 0.0431682707 1.098646e-01
5: xxxxx 6.004842e-02 0.0305611830 1.709108e-02
214: xxxxxxxxxx 4.599139e-06 0.0001551098 1.147052e-05
215: xxxxxxxxxx 4.500927e-06 0.0001665320 1.147052e-05
216: xxxxxxxxxxxx 3.899363e-06 0.0001536857 1.147052e-05
217: xxxxxxxxxxxxxx 3.619348e-06 0.0001808504 1.147052e-05
218: xxxxxxxxxxxxx 3.429679e-06 0.0001792233 1.147052e-05