«loss-functions» etiketlenmiş sorular

Bir modele göre, gözlemlenen veriler ile öngörülen değerler arasındaki farkı ölçmek için kullanılan bir işlev. Kayıp fonksiyonlarının en aza indirilmesi, modelin parametrelerini tahmin etmenin bir yoludur.

2
Neden iki farklı lojistik kayıp formülasyonu / gösterimi var?
İki tür lojistik kayıp formülasyonu gördüm. Kolayca aynı olduklarını kolayca gösterebiliriz, tek fark etiketinin tanımıdır .yyy Formülasyon / gösterim 1, :y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) burada lojistik fonksiyon bir gerçek sayı harita, 0,1 aralığı. βTxp=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x Formülasyon / gösterim 2, :y∈{−1,+1}y∈{−1,+1}y \in \{-1, +1\} L(y,βTx)=log(1+exp(−y⋅βTx))L(y,βTx)=log⁡(1+exp⁡(−y⋅βTx)) L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) …

2
Sert marj SVM'nin kayıp fonksiyonu nedir?
İnsanlar yumuşak marj menteşe kaybı fonksiyonunu kullandığını söylüyor: . Bununla birlikte, yumuşak marjlı SVM'nin en aza indirmeye çalıştığı asıl amaç işlevi \ frac {1} {2} \ | w \ | ^ 2 + C \ sum_i \ max (0,1-y_i (w ^ \ intercal x_i + b) ) Bazı yazarlar \ …

1
Sinir ağlarının maliyet fonksiyonu neden dışbükey değildir?
Burada da benzer bir iş parçacığı var ( Sinir ağının maliyet işlevi dışbükey değil mi? ) Fakat buradaki cevaplardaki noktaları anlayamadım ve bunun tekrar sorulma nedeninin bazı sorunları netleştireceğini umuyorum: I karesi alınmış farkı maliyet fonksiyonunun toplamı kullanıyorum için, sonuçta formun şey optimize am y eğitim aşaması esnasında gerçek etiket …

5
Rastgele Ormanlarda yanlış sınıflandırma maliyeti nasıl kontrol edilir?
RandomForest R paketindeki yanlış sınıflandırma maliyetini kontrol etmek mümkün müdür ? Kendi işimde yanlış negatifler (örneğin, bir insanın bir hastalığa sahip olabileceği gibi yanlış) eksik, yanlış pozitiflerden çok daha maliyetlidir. Rpart paketi , kullanıcının farklı sınıflandırma ağırlıklarına göre farklılıklar için bir kayıp matrisi belirleyerek yanlış sınıflandırma maliyetlerini kontrol etmesine izin …

3
Egzersiz kaybı zamanla artar [çift]
Bu sorunun cevabı burada zaten var : Maliyet işlevindeki değişim nasıl olumlu olabilir? (1 cevap) Sinir ağım öğrenmediğinde ne yapmalıyım? (5 cevaplar) Geçen ay kapalı . 4 tip diziyi sınıflandırmak için bir model (Tekrarlayan Sinir Ağı) eğitimi alıyorum. Eğitimimi yürütürken eğitim grubumdaki örneklerin% 90'ından fazlasını doğru bir şekilde sınıflandırdığım noktaya …

6
Parametreleri tahmin etmek için 'temel' makine öğrenimi fikri nedir?
Parametreleri tahmin etmek için 'temel' istatistik fikri maksimum olasılıktır . Makine öğreniminde buna karşılık gelen fikrin ne olduğunu merak ediyorum. Sn 1. Parametreleri tahmin etmek için makine öğrenmesindeki 'temel' fikrin 'Kayıp Fonksiyonları' olduğunu söylemek adil olur mu? [Not: Makine öğrenimi algoritmalarının genellikle bir kayıp fonksiyonunu ve dolayısıyla yukarıdaki soruyu optimize …

3
0-1 Kayıp İşlevi açıklaması
Kayıp fonksiyonunun amacının ne olduğunu kavramaya çalışıyorum ve bunu tam olarak anlayamıyorum. Yani, anladığım kadarıyla kayıp fonksiyonu, yanlış bir kararın "maliyetini" ölçebileceğimiz bir tür metrik sunmaktır. Diyelim ki 30 nesne veri setim var, bunları 20/10 gibi eğitim / test setlerine böldüm. 0-1 kayıp işlevini kullanacağım, bu yüzden sınıf etiketleri setimin …

1
İkili sınıflandırma için kayıp fonksiyonları arasında seçim yapma
İnsanların sıklıkla ROC-AUC veya AveP (ortalama hassasiyet) bildirdiği bir sorun alanında çalışıyorum . Ancak, yakın zamanda Log Loss'i optimize eden kağıtlar buldum , ancak diğerleri Menteşe Kaybını bildirdi . Bu metriklerin nasıl hesaplandığını anlasam da , aralarındaki ödünleşimleri anlamakta zorlanıyorum ve bu tam olarak ne için iyi. ROC-AUC ve Precision-Recall'a …

4
Bayes ve sık sık nokta tahmin edicileri hangi koşullar altında çakışır?
Düz bir öncekiyle, ML (sıklık - maksimum olasılık) ve MAP (Bayes - maksimum posteriori) tahmin edicileri çakışır. Bununla birlikte, daha genel olarak, bazı kayıp fonksiyonlarının iyileştiricileri olarak türetilen nokta tahmin edicilerden bahsediyorum. yani (Bayesian) x (x^(.)=argminE(L(X−x^(y))|y) (Bayesian) x^(.)=argminE(L(X−x^(y))|y) (Bayesian) \hat x(\,. ) = \text{argmin} \; \mathbb{E} \left( L(X-\hat x(y)) \; …

2
Toplamlar yerine partilerin ortalama kaybını en aza indirmek yaygın bir uygulama mıdır?
Tensorflow, CIFAR-10'u sınıflandırma hakkında örnek bir öğreticiye sahiptir . Eğitimde, toplu işteki ortalama çapraz entropi kaybı en aza indirilmiştir. def loss(logits, labels): """Add L2Loss to all the trainable variables. Add summary for for "Loss" and "Loss/avg". Args: logits: Logits from inference(). labels: Labels from distorted_inputs or inputs(). 1-D tensor of …

2
Lojistik regresyon ortamında kare kayıp kullandığımda ne oluyor?
Bir oyuncak veri kümesi üzerinde ikili sınıflandırma yapmak için kare kaybı kullanmaya çalışıyorum. mtcarsVeri seti kullanıyorum , iletim tipini tahmin etmek için galon başına mil ve ağırlık kullanıyorum. Aşağıdaki grafik, farklı renkteki iki tür iletim tipi verisini ve farklı kayıp fonksiyonu tarafından oluşturulan karar sınırını göstermektedir. Kare kayıp burada temel …


4
Kayıp fonksiyonlarına kapsamlı bir bakış?
Makine öğrenimindeki bazı temel fikirler hakkında küresel bir bakış açısı elde etmeye çalışıyorum ve farklı kayıp kavramlarının (kare, günlük, menteşe, proxy, vb.) Kapsamlı bir tedavisi olup olmadığını merak ediyordum. John Langford'ın Kayıp İşlevi Semantiği hakkındaki mükemmel yazısının daha kapsamlı ve resmi bir sunum çizgisi boyunca bir şeyler düşünüyordum .


3
menteşe kaybı ve lojistik kayıp avantajları ve dezavantajları / sınırlamaları
Menteşe kaybı ve günlük kaybımaks. ( 0 , 1 - ybenwTxben)maksimum(0,1-ybenwTxben)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)günlük ( 1 + exp( - ybenwTxben) )günlük(1+tecrübe⁡(-ybenwTxben))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) Aşağıdaki sorularım var: Menteşe kaybı her dezavantajları (örneğin belirtildiği gibi uçlara karşı duyarlıdır var http://www.unc.edu/~yfliu/papers/rsvm.pdf )? Birinin diğerine göre farkları, avantajları ve dezavantajları nelerdir?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.