Bir kayıp fonksiyonu ile karar fonksiyonu arasındaki fark nedir?


Yanıtlar:


45

Bir karar işlevi , girdi olarak bir veri kümesi alır ve çıktı olarak bir karar veren bir fonksiyonudur. Kararın ne olabileceği eldeki soruna bağlıdır. Örnekler şunları içerir:

  • Tahmin sorunları: "karar" tahmindir.
  • Hipotez test problemleri: Karar, boş hipotezi reddetmek veya reddetmektir.
  • Sınıflandırma problemleri: Karar, yeni bir gözlemi (veya gözlemleri) bir kategoriye sınıflandırmaktır.
  • Model seçimi problemleri: Karar, aday modellerden birini seçmektir.

Genellikle, bir sorun için sınırsız sayıda karar işlevi vardır. Örneğin, İsveçli erkeklerin on gözlemine dayalı yüksekliğini tahmin etmekle ilgileniyorsak , aşağıdaki karar işlevlerinden herhangi birini kullanabiliriz d ( x ) :x=(x1,x2,...,x10)d(x)

  • Örnek ortalama: .d(x)=110Σben=110xben
  • Numunenin ortancası: d(x)=medyan(x)
  • Numunenin geometrik ortalaması: d(x)=x1x1010
  • İşlevi, her zaman 1 döndürür: olursa değerinin, x . Aptal, evet, ama yine de geçerli bir karar işlevidir.d(x)=1x

O zaman bu karar işlevlerinden hangisinin kullanılacağını nasıl belirleyebiliriz? Bunun bir yolu, olası tüm kararlarla ilgili kaybı (veya maliyeti) tanımlayan bir kayıp işlevi kullanmaktır . Farklı karar fonksiyonları farklı tür hatalara yol açma eğilimindedir. Kayıp işlevi bize hangi tür hatalardan daha fazla endişe etmemiz gerektiğini söyler. En iyi karar işlevi, beklenen en düşük zararı veren işlevdir . Beklenen kayıp ile kastedilen, ayara bağlıdır (özellikle, sık veya Bayesian istatistiklerinden bahsettiğimizden ).

Özetle:

  • Karar fonksiyonları verilere göre karar vermek için kullanılır.
  • Kayıp fonksiyonları, hangi karar fonksiyonunun kullanılacağını belirlemek için kullanılır.

Parametrik karar fonksiyonları için (örneğin: lojistik regresyon, eşik kararı) temel olarak her parametre kombinasyonu için olası bir fonksiyonunuz vardır ve kayıp fonksiyonu en iyisini bulmak için kullanılır. Yaygın örnek: Parametre alanını keşfetmek için degrade iniş kullanırsanız, kaybı parametrelere göre türetir ve minimum (yerel) kayıptan aşağı inersiniz.
pixelou

7

Kayıp fonksiyonu, bir anlamda optimal olan bir model elde etmek için en aza indirgenmiş olandır. Modelin kendisinin tahmin etmek için kullanılan bir karar işlevi vardır.

Örneğin, SVM sınıflandırıcılarında:

  • kayıp fonksiyonu: Ayırıcı hiper düzlem hata ve kare normlarını en aza indirirL(w,ξ)=12w2+CΣbenξben
  • f(x)=wTx+b

Norm, mesafeye eşit değil mi, yoksa burada bir şeyi karıştırıyor muyum ... Yani karar fonksiyonu her zaman bir modeli düzeltmeye çalıştığım gerçek değerlerle "karşılaştırmak" için kullandığım kayıp fonksiyonunun bir parçası mıdır? Ve amaç bu "farkı" en aza indirgemek mi?
www.pieronigro.de

@Hiatus ayırıcı hiper düzlemin normu (bir SVM antremanı sırasında optimize edilmiştir) karar fonksiyonunda kullanılmaz. Hiper uçağın kendisi kullanılır. Eğitim sırasındaki normların en aza indirilmesi, temelde bir düzenlileştirme şeklidir.
Marc Claesen

Belirli bir sınıflandırıcıya bağlı olmayan daha genel bir cevap vermek daha iyi olacaktır.
smci
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.