Çekirdek Sırtı Regresyon Verimliliği


11

Ridge Regresyonu burada öngörülen etikettir , , matris tanımlamak biz için bir etiket bulmaya çalışıyorsanız nesne ve matrisi nesnelerin şöyle:

y^=(XX+aId)1Xx
y^Idd×dxXn×dnxi=(xi,1,...,xi,d)Rd

X=(x1,1x1,2x1,dx2,1x2,2x2,dxn,1x1,2xn,d)

Bunu şu şekilde çekirdeklendirebiliriz:

y^=(K+aId)1k

burada , çekirdek fonksiyonlarının matrisidirKn×nK

K=(K(x1,x1)K(x1,x2)K(x1,xn)K(x2,x1)K(x2,x2)K(x2,xn)K(xn,x1)K(xn,x2)K(xn,xn))

ve n \: 1 ile çekirdek fonksiyonlarının kolon vektörü Kkn×1K

k=(K(x1,x)K(x2,x)K(xn,x))

Sorular:

(a) 'da daha fazla nesne olup olmadığını boyutlarından daha bunun için mantıklı değildir çekirdek kullanmak? Örneğin izin , bir olmak daha sonra matris , bir olacaktır ve bir tersine çevrilmesi sona erecek matris yerine daha fazla ters çevirmek zorunda kalacağız. Bu, olursa, çekirdek kullanmamamız gerektiği anlamına mı geliyor ?xbenX50x3X'X3x33x350x50dn

(b) mümkün olan en basit çekirdek kullanılmalı mı? Sırt regresyonundaki çekirdekler, boyutsallığın etkilerini ortadan kaldırmak ve özellik alanının belirli özelliklerini (destek vektör makinelerinin aksine) kullanmamak için kullanılıyor gibi görünüyor. Çekirdekler nesneler arasındaki mesafeleri değiştirebilmesine rağmen, sırt regresyonunda kullanılan herhangi bir popüler çekirdek var mı?

(c) sırt regresyonunun ve / veya çekirdek sırt regresyonunun zaman karmaşıklığı nedir?Ö


'verimlilik' istatistiklerde farklı bir anlama sahiptir. Şunu mu demek istediniz: 'computational complexity'? (başlıkta)
Memming

"Algoritmik verimlilik" demek istedim. Her ne kadar sorularımın bunu temelde "hesaplama karmaşıklığına" indirgediği doğru.
Helix

Yanıtlar:


5

(a) Çekirdek kullanmanın amacı, bu durumda doğrusal olmayan bir regresyon problemini çözmektir. İyi bir çekirdek, problemleri muhtemelen sonsuz boyutlu bir özellik alanında çözmenize izin verecektir. Ancak, doğrusal bir çekirdek ve çift boşlukta çekirdek sırtı regresyonu yapmak, birincil boşluktaki problemi çözmekle aynıdır yani herhangi bir avantaj sağlamaz (gözlemlediğiniz gibi örnek sayısı arttıkça çok daha yavaştır).K(x,y)=xy

(b) En popüler seçeneklerden biri kare üstel çekirdek bu evrenseldir (aşağıdaki referansa bakınız). Çok sayıda çekirdek vardır ve her biri özellik alanınıza farklı iç ürünler (ve dolayısıyla metrik) sağlar.K(x,y)=tecrübe(-τ2||x-y||2)

(c) Kolay uygulama, boyutunda doğrusal bir denklemin çözülmesini gerektirir , bu yüzden . Nyström yaklaşımı gibi çok daha hızlı yaklaşım yöntemleri vardır. Bu aktif bir araştırma alanıdır.nÖ(n3)

Referanslar:

  1. Bharath Sriperumbudur, Kenji Fukumizu ve Gert Lanckriet. Evrensellik, karakteristik çekirdekler ve RKHS önlemlerinin gömülmesi arasındaki ilişki üzerine. Makine Öğrenimi Araştırmaları Dergisi, 9: 773–780, 2010.
  2. Bernhard Schlkopf, Alexander J. Smola. Çekirdeklerle Öğrenme: Destek Vektör Makineleri, Düzenleme, Optimizasyon ve Ötesi 2002
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.