Lojistik regresyon problemi için karar_fonksiyonu, tahmin_proba ve tahmin fonksiyonu arasındaki fark nedir?


10

Sklearn belgelerinden geçiyorum ama lojistik regresyon bağlamında bu işlevlerin amacını anlayamıyorum. Çünkü decision_functionhiper düzlem ve test örneği arasındaki mesafe olduğunu söylüyor. bu belirli bilgiler nasıl faydalıdır? ve bunun yöntem predictve predict-probayöntemler ile ilişkisi nedir?

Yanıtlar:


29

Lojistik regresyonun fonksiyonel formunun

f(x)=11+e(β0+β1x1++βkxk)

Tarafından döndürülen budur predict_proba.

Üstel İçindeki Terim

d(x)=β0+β1x1++βkxk

tarafından döndürülen şeydir decision_function. Belgelerde atıfta bulunulan "köprü"

β0+β1x1++βkxk=0

Bu terminoloji, tam anlamıyla bir ayırma hiper düzlemini tahmin eden destek vektör makinelerinden bir engeldir. Lojistik regresyon için bu hiper düzlem biraz yapay bir yapıdır, modelin her iki hedef sınıfın da eşit derecede olası olduğunu belirlediği eşit olasılık düzlemidir.

predictFonksiyon kuralı kullanarak bir sınıf kararı döndürür

f(x)>0.5

Sabunlama riski altında, predictişlevin çok az meşru kullanımı vardır ve başkalarının işlerini incelerken bunu bir hata işareti olarak kullanıyorum. Ben sklearn kendisi bir tasarım hatası olarak adlandırmak için yeterince ileri gider ( predict_probaişlev çağrılmış predictve herhangi bir şey varsa, predictçağrılmış olması gerekirdi predict_class).


@Matthew cevabı için teşekkürler, ancak bu noktayı biraz daha açıklığa kavuşturabilirsiniz "Lojistik regresyon için, bu hiper düzlem biraz yapay bir yapıdır, modelin her iki hedef sınıfın eşit derecede olası olduğunu belirlediği eşit olasılık düzlemidir. ." ?
Aynı

Bu açıklama ilginç ve yararlı. Keşke sklearn daha iyi açıklasaydı. Anlamıyorum ne lojistik fonksiyonu 1 / (1 + e ^ -x) x değerini bilmenin kullanımı nedir? Tek düşünebildiğim, x / (1+ | x |) gibi farklı bir sigmoid işlevi kullanmaktır. Daha fazla var mı? Teşekkürler!
ldmtwo

Temel olarak karar fonksiyonu lojistik regresyonda sigmoid olmalıydı. Doğru?
3nomis

2
@Matthew'un bir sabun kutusunda olmasının sebebinin, tahmin eşiği olarak 0.5 kullanmanın naif olmasıdır. Yapılması gereken ilk şey, uygun bir c eşiği seçmek için çapraz validasyon, ROC eğrileri ve AUC kullanmayı ve f (x)> c karar fonksiyonu olarak kullanmayı öğrenmektir.
hwrd
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.