XGboost - Modele göre seçim


10

sigorta iddiaları 2 sınıf hedef değişken tahmin etmek için XGboost kullanıyorum . Başka bir veri kümesi üzerinde çalıştırmak bir model var (çapraz doğrulama, hiper parametreler ayarlama vb ...) var.

Sorum şu:

verilen bir iddianın bir sınıfa neden etkilendiğini bilmenin bir yolu var mı , yani model tarafından yapılan seçimi açıklayan özellikler?

Amaç, makine tarafından üçüncü taraf insana yapılan seçimi gerekçelendirmektir.

Cevabınız için teşekkürler.

Yanıtlar:


7

Shap'a gitmeni öneririm . Model davranışını tanımlamak için Shapley değerlerini (Oyun Teorisinden ödünç alınan kavram) kullanır ve bununla birlikte tek bir tahmini açıklayabilir.

Grafik arayüzü, aşağıda gördüğünüz gibi Kuvvet Grafiğini kullanır. resim açıklamasını buraya girin

Kırmızı çubuk, tahmini pozitif değerlere, mavi ise diğer değerlere götüren özellikler tarafından oluşturulmuştur.

Sizin durumunuzda (bir sınıflandırıcı) kalın harflerle gösterilen sayı , çıkış değerini sıfır ile bir arasında (bir sınıf ya da diğeri) sınırlandıracak sigmoid işlevinden hemen önceki sayı olacaktır . Bu nedenle, bazı durumlarda birden fazla veya negatif olacaksa korkmayın.

Segmentlerin boyutu, bu özelliğin tahmine ne kadar katkıda bulunduğunu temsil eder ve segmentlerin altında özelliğin adını (ör. LSTAT) ve gerçek değerini (ör. 4.98) görürsünüz. Dolayısıyla, bu durumda, LSTAT, veri kümesinin o öğesinin tahminini 24,41 değerine (kalın harflerle) yönlendiren ortalama özelliktir.

Zevk almak!


9

XGBoost modelleri için bireysel tahminlere özellik katkılarını açıklamak için ELI5 kütüphanesini kullanabilirsiniz .

Aşağıda kopyalanan dokümanlardaki Tahminleri Açıklama konusuna bakın:

Sınıflandırıcımızın nasıl çalıştığı hakkında daha iyi bir fikir edinmek için, bireysel tahminleri aşağıdakilerle inceleyelim eli5.show_prediction():

from eli5 import show_prediction
show_prediction(clf, valid_xs[1], vec=vec, show_feature_values=True)

resim açıklamasını buraya girin


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.