Ep-SVR ve nu-SVR arasındaki fark (ve en küçük kareler SVR)


11

Bu tür veriler için hangi SVR'nin uygun olduğunu bulmaya çalışıyorum.

4 tip SVR biliyorum:

  • epsilon
  • nu
  • en küçük kareler ve
  • doğrusal.

Doğrusal SVR'nin L1 Reg ile kement gibi az çok olduğunu anlıyorum, ancak kalan 3 teknik arasındaki fark nedir?

Yanıtlar:


11

In -SVR, parametre size veri kümesindeki örneklerin toplam sayısı bakımından da çözümde tutmak için arzu destek vektörlerin sayısına oranını belirlemek için kullanılır. In -SVR parametresi optimizasyon problemi formülasyona dahil edilir ve otomatik olarak (optimum) sizin için tahmin edilmektedir.ν ν ϵνννϵ

Bununla birlikte, -SVR'de, veri kümesinden kaç veri vektörünün destek vektörleri haline geldiği konusunda hiçbir kontrole sahip değilsiniz, birkaç olabilir, çok olabilir. Bununla birlikte, modelinizin ne kadar hataya izin vereceğiniz konusunda tam kontrole sahip olacaksınız ve belirtilen ötesindeki herhangi bir şey , normalleştirme parametresi olan ile orantılı olarak cezalandırılacak .ϵ CϵϵC

Ne istediğime bağlı olarak, ikisi arasında seçim yaparım. Küçük bir çözüm için gerçekten umutsuzsam (daha az destek vektörü) -SVR'yi seçiyorum ve iyi bir model almayı umuyorum . Ama eğer gerçekten modelimdeki hata miktarını kontrol etmek ve en iyi performansı elde etmek istiyorsanız, -SVR'yi seçiyorum ve modelin çok karmaşık olmadığını umuyorum (birçok destek vektörü).ϵνϵ


5

-SVR ve ν -SVR arasındaki fark , eğitim sorununun nasıl parametrelendirildiğidir. Her ikisi de maliyet işlevinde bir tür menteşe kaybı kullanır. Ν -SVM içindeki ν parametresi , ortaya çıkan modeldeki destek vektörlerinin miktarını kontrol etmek için kullanılabilir. Uygun parametreler verildiğinde, aynı problem çözüldü. 1ϵννν

En küçük kareler SVR, menteşe kaybı yerine maliyet fonksiyonunda kare kalıntılar kullanarak diğer ikisinden farklıdır.

1 : C.-C. Chang ve C.-J. Lin. Ν -destek vektör regresyonu eğitimi : Teori ve algoritmalarν . Sinirsel Hesaplama, 14 (8): 1959-1977, 2002.


Cevabınız için teşekkürler Marc. Öyleyse sahip olduğumuz veri kümesine göre uygun yöntemi ayırt edebilir miyiz? Eğer öyleyse, bana bazı işaretçiler verebilir misiniz? 200 farklı çıktıya sahip 40000 örneğim var. Yani 200 takım 200 benzersiz örnek olarak düşünülebilir. 40000'ün tümü için giriş farklıdır, sadece çıktı 200 numune için benzersizdir.
Sharath Chandra

0

Hem Pablo hem de Marc cevaplarını seviyorum. Bir ek nokta:

Marc tarafından alıntılanan makalede yazılmıştır (bölüm 4)

νϵϵϵy

[...]

ϵyϵ[-1,+1]ε[0,1]νε

εε-ν-

Ne düşünüyorsun?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.