Ep-SVR ve nu-SVR arasındaki fark (ve en küçük kareler SVR)

11

Bu tür veriler için hangi SVR'nin uygun olduğunu bulmaya çalışıyorum.

4 tip SVR biliyorum:

epsilon
nu
en küçük kareler ve
doğrusal.

Doğrusal SVR'nin L1 Reg ile kement gibi az çok olduğunu anlıyorum, ancak kalan 3 teknik arasındaki fark nedir?

regression svm

— Sharath Chandra
kaynak

11

In -SVR, parametre size veri kümesindeki örneklerin toplam sayısı bakımından da çözümde tutmak için arzu destek vektörlerin sayısına oranını belirlemek için kullanılır. In -SVR parametresi optimizasyon problemi formülasyona dahil edilir ve otomatik olarak (optimum) sizin için tahmin edilmektedir. $\nu$ $\nu$ $\nu$ $\epsilon$

Bununla birlikte, -SVR'de, veri kümesinden kaç veri vektörünün destek vektörleri haline geldiği konusunda hiçbir kontrole sahip değilsiniz, birkaç olabilir, çok olabilir. Bununla birlikte, modelinizin ne kadar hataya izin vereceğiniz konusunda tam kontrole sahip olacaksınız ve belirtilen ötesindeki herhangi bir şey , normalleştirme parametresi olan ile orantılı olarak cezalandırılacak . $\epsilon$ $\epsilon$ $C$

Ne istediğime bağlı olarak, ikisi arasında seçim yaparım. Küçük bir çözüm için gerçekten umutsuzsam (daha az destek vektörü) -SVR'yi seçiyorum ve iyi bir model almayı umuyorum . Ama eğer gerçekten modelimdeki hata miktarını kontrol etmek ve en iyi performansı elde etmek istiyorsanız, -SVR'yi seçiyorum ve modelin çok karmaşık olmadığını umuyorum (birçok destek vektörü). $\nu$ $\epsilon$

— Pablo Rivas
kaynak

5

-SVR ve -SVR arasındaki fark , eğitim sorununun nasıl parametrelendirildiğidir. Her ikisi de maliyet işlevinde bir tür menteşe kaybı kullanır. -SVM içindeki parametresi , ortaya çıkan modeldeki destek vektörlerinin miktarını kontrol etmek için kullanılabilir. Uygun parametreler verildiğinde, aynı problem çözüldü. ¹ $\epsilon$ $\nu$ $\nu$ $\nu$

En küçük kareler SVR, menteşe kaybı yerine maliyet fonksiyonunda kare kalıntılar kullanarak diğer ikisinden farklıdır.

¹ : C.-C. Chang ve C.-J. Lin. -destek vektör regresyonu eğitimi : Teori ve algoritmalar $\nu$ . Sinirsel Hesaplama, 14 (8): 1959-1977, 2002.

— Marc Claesen
kaynak

Cevabınız için teşekkürler Marc. Öyleyse sahip olduğumuz veri kümesine göre uygun yöntemi ayırt edebilir miyiz? Eğer öyleyse, bana bazı işaretçiler verebilir misiniz? 200 farklı çıktıya sahip 40000 örneğim var. Yani 200 takım 200 benzersiz örnek olarak düşünülebilir. 40000'ün tümü için giriş farklıdır, sadece çıktı 200 numune için benzersizdir.

— Sharath Chandra

0

Hem Pablo hem de Marc cevaplarını seviyorum. Bir ek nokta:

Marc tarafından alıntılanan makalede yazılmıştır (bölüm 4)

$\nu$ $\epsilon$ $\epsilon$ $\epsilon$ $y$

[...]

$\epsilon$ $y$ $\epsilon$ $[-1,+1]$ $\epsilon$ $[0, 1]$ $\nu$ $\epsilon$

$\epsilon$ $\epsilon -$ $\nu -$

Ne düşünüyorsun?

— spec3
kaynak