Radyal temel fonksiyonunun bir çekirdek olduğunu nasıl ispatlayabilirim?


35

Radyal temel işlevinin bir çekirdek olduğunu nasıl ispatlayabilirim ? Anladığım kadarıyla, bunu kanıtlamak için aşağıdakilerden birini kanıtlamamız gerekiyor:k(x,y)=exp(||xy||2)2σ2)

  1. Herhangi bir vektör kümesi için, matrisi = pozitif yarı-sonludur.x1,x2,...,xnK(x1,x2,...,xn)(k(xi,xj))n×n

  2. Bir eşleme Φ , k(x,y) = Φ(x),Φ(y) .

Herhangi bir yardım?


1
Sadece daha açık bir şekilde bağlamak için: özellik haritası da bu soruda tartışılmıştır , özellikle Marc Claesen'in Taylor serisine ve benim cevabına dayanan cevabı , hem RKHS hem de aşağıdaki Douglas tarafından verilen L2 gömülmesinin genel versiyonunu tartışmaktadır .
Dougal

Yanıtlar:


26

Zen yöntem 1 kullandı. İşte yöntem 2: x'i Hilbert uzay L ^ 2'de xx merkezli, küresel simetrik bir Gauss dağılımına eşleyin . Bunun tam olarak çalışması için standart sapma ve sabit bir faktör ayarlanması gerekir. Örneğin, bir boyuttaxL2

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

Bu nedenle, standart bir \ sigma / \ sqrt 2 sapma kullanın σ/2ve Gauss dağılımını ölçeklendirerek k(x,y)=Φ(x),Φ(y) . Bu son yeniden ölçeklendirme, normal dağılımın L2 normunun genel olarak 1 olmaması nedeniyle oluşur 1.


2
@Zen, Douglas Zare: Harika cevaplarınız için teşekkürler. Şimdi resmi cevabı nasıl seçeceğim?
Leo

23

Yöntem 1'i kullanacağım. Yöntem 2'yi kullanarak Douglas Zare'in cevabını 2 ispatı kullanarak kontrol edin.

gerçek sayı olduğu durumlarda durumu ispatlayacağım , bu yüzden . Genel durum mutatis mutandis'i aynı argümandan izler ve yapmaya değer.k ( x , y ) = exp ( - ( X - Y ) 2 / 2 σ 2 )x,yk(x,y)=exp(-(x-y)2/2σ2)

Genelliğini kaybetmeden, olduğunu varsayalım .σ2=1

Yaz , burada , dağılımlı , rastgele bir değişkeninin karakteristik işlevidir .h ( t ) = exp ( - t 2k(x,y)=h(x-y), Z, N(0,1)

h(t)=exp(-t22)=E[ebentZ]
ZN-(0,1)

Gerçek sayılar için ve , ki bu, pozitif bir yarı-sonlu fonksiyon olduğunu, yani bir çekirdek olduğunu gösterir.a 1 , , a n n j , k = 1 a jx1,...,xnbir1,...,birnk

Σj,k=1nbirjbirkh(xj-xk)=Σj,k=1nbirjbirkE[eben(xj-xk)Z]=E[Σj,k=1nbirjebenxjZbirke-benxkZ]=E[|Σj=1nbirjebenxjZ|2]0,
k

Bu sonucu daha fazla genellikte anlamak için Bochner Teoremini inceleyin: http://en.wikipedia.org/wiki/Positive-definite_function


2
Bu, iki yönde iyi bir başlangıçtır, doğru yönde: (a) gösterilen beklenti ile aynı değildir (üsdeki işareti kontrol edin) ve (b) bu ​​durumun dikkatini kısıtlıyor gibi görünüyor ve skalerdir ve vektör değildir. Bu süre zarfında çok başarılı oldum, çünkü fuar güzel ve temiz ve bu küçük boşlukları hemen takacağınızdan eminim. :-)x yh(t)xy
kardinal

1
Tks! Acelem var burada. :-)
Zen

1
Affedersiniz, burada mutatis mutandis'i nasıl yönettiğinizi gerçekten anlamıyorum. Eğer formuna geçmeden önce norm geliştirirseniz, ürün elde edersiniz ve ürün ve toplamı değiştiremezsiniz. Ve ben sadece güzel bir ifade elde etmek için h formuna geçtikten sonra normu nasıl geliştireceğimi göremiyorum. Beni biraz oraya götürebilir misin? :)h
Alburkerk

23

Sadece çeşitlilik için üçüncü bir yöntem ekleyeceğim: çekirdeği pd çekirdeği oluşturduğu bilinen bir genel adımlar dizisinden oluşturmak. aşağıdaki çekirdeğin alanını göstermesine ve özellik haritalarının olmasına izin verin . φXφ

  • Ölçekleme: Eğer isimli bir pd çekirdeği, böyledir herhangi sabiti için .y globülini k y > 0κγκγ>0

    Kanıt: için özellik haritasıysa , için geçerli bir özellik haritasıdır .κ φκγκγφγκ

  • Toplamları: Eğer ve pd çekirdekleri vardır, böyledir .κ 2 κ 1 + κ 2κ1κ2κ1+κ2

    Kanıt: ı elde etmek için ve özellik haritalarını .φ 2 x [ φ 1 ( x ) φ 2 ( x ) ]φ1φ2x[φ1(x)φ2(x)]

  • Sınırları: Eğer pd çekirdekleri ve vardır her için var , daha sonra pd'dir.κ ( x , y ) : = lim n κ n ( x , y ) x , y κκ1,κ2,...κ(x,y): =limnκn(x,y)x,yκ

    Korumalı: her biri için her o var . Limiti olarak almak, için aynı özelliği verir .{ ( x i , c i ) } m i = 1X × R m i = 1 c i κ n ( x i , x j ) c j0 n κm,n1{(xben,cben)}ben=1mXxR,Σben=1mcbenκn(xben,xj)cj0nκ

  • Ürünler: Eğer ve pd çekirdekleri, bu nedenle bir .κ 2 g ( x , y ) = κ 1 ( x , y )κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    Kanıt: Schur ürün teoreminden hemen sonra gelir , ancak Schölkopf ve Smola (2002) aşağıdaki güzel, temel kanıtı verir. Bırakın bağımsız olun. Böylece Kovaryans matrisleri psd olmalıdır, bu nedenle kovaryans matrisini göz önüne alarak bunu kanıtlar. C o v ( V i W i , V j W j ) = C o v ( V i , V j )

    (V1,...,Vm)~N-(0,[κ1(xben,xj)]benj)(W1,...,Wm)~N-(0,[κ2(xben,xj)]benj)
    COv(VbenWben,VjWj)=COv(Vben,Vj)COv(Wben,Wj)=κ1(xben,xj)κ2(xben,xj).
    (V1W1,...,VnWn)
  • Güçler: Eğer isimli bir Pd çekirdek, so herhangi bir pozitif tamsayı için .κκn(x,y): =κ(x,y)nn

    Kanıt: "ürünler" özelliğinden hemen.

  • Üstel: Eğer isimli bir Pd çekirdek, so .κeκ(x,y): =exp(κ(x,y))

    İspat: Elimizde ; "güçler", "ölçekler", "toplamlar" ve "sınırlar" özelliklerini kullanın.eκ(x,y)=limN-Σn=0N-1n!κ(x,y)n

  • Özellikler: Eğer isimli bir Pd, çekirdek ve , olarak iyi.κf:XR,g(x,y): =f(x)κ(x,y)f(y)

    Kanıt: özellik haritasını kullanın .xf(x)φ(x)

Şimdi, Doğrusal çekirdek ile başla , "ölçeklendirme" uygulayın, "üstler" uygulayın ve " " işlevlerini .κ(x,y)=xTy1

k(x,y)=exp(-12σ2x-y2)=exp(-12σ2x2)exp(1σ2xTy)exp(-12σ2y2).
κ(x,y)=xTy xexp(-11σ2xexp(-12σ2x2)
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.