Bence büyünün anahtarı pürüzsüzlük. Takip eden uzun cevabım, sadece bu pürüzsüzlük hakkında açıklamaktır. Beklediğiniz bir cevap olabilir veya olmayabilir.
Kısa cevap:
Pozitif kesin bir çekirdek verildiğinde , karşılık gelen işlev alanı . Fonksiyonların özellikleri çekirdek tarafından belirlenir. Eğer bir Gauss çekirdeği ise, deki fonksiyonların çok düzgün olduğu ortaya çıktı. Bu nedenle, öğrenilmiş bir işlev (örneğin, bir regresyon işlevi, çekirdek PCA'daki gibi RKHS'deki temel bileşenler) çok yumuşaktır. Genellikle düzgünlük varsayımı, ele almak istediğimiz çoğu veri kümesi için mantıklıdır. Bu bir Gauss çekirdeğinin neden sihirli olduğunu açıklar.H k HkHkH
Bir Gauss çekirdeğinin neden pürüzsüz işlevler verdiğine dair uzun cevap:
Pozitif kesin bir çekirdek , (dolaylı olarak) bir iç ürün
özellik vektörü için , giriş yapılmış ve
Hilbert alanıdır. gösterimi ve
arasında bir iç ürün anlamına gelir . Amacımız, nin olağan Öklid uzayı olduğunu ancak muhtemelen sonsuz sayıda boyutta olduğunu hayal edebilirsiniz . gibi uzun süren normal vektörleri hayal edin.k ( x , y ) = ⟨ φ ( x ) , φ ( y ) ⟩ H φ ( x ) x H ⟨ φ ( x ) , φ ( y ) ⟩ φ ( x ) φ ( y ) H ϕ ( x ) = ( ϕ 1 ( xk(x,y)k(x,y)=⟨ϕ(x),ϕ(y)⟩Hϕ(x)xH⟨ϕ(x),ϕ(y)⟩ϕ(x)ϕ(y)H H f ( x ) = ⟨ f , φ ( x ) ⟩ f ( x ) f x φ ( x ) f ( x ) kϕ(x)=(ϕ1(x),ϕ2(x),…). Çekirdek yöntemlerinde, , çekirdek Hilbert uzayını (RKHS) çoğaltma denilen bir işlev alanıdır. Bu alan `` reproducing property '' adında özel bir özelliğe sahiptir ki bu . Bu değerlendirmek için söylüyor (sonsuz uzunlukta belirtildiği gibi) için ilk önce bir özellik vektörü inşa, . Sonra için özellik vektörü inşa ile gösterilir (sonsuz uzunluğunda). in değerlendirmesi , ikisinin iç ürünü alınarak yapılır. Açıkçası, pratikte hiç kimse sonsuz derecede uzun bir vektör inşa etmeyecek. Biz sadece kendi iç ürün hakkında bakım yana, sadece doğrudan çekirdek değerlendirmekHf(x)=⟨f,ϕ(x)⟩f(x)fxϕ(x)f(x)k. Açık özelliklerin hesaplanmasının atlanması ve doğrudan iç ürününün hesaplanması "çekirdek numarası" olarak bilinir.
Özellikleri nelerdir?
Ne olduğunu özellikleri . Bir çekirdek verildiğinde , özellikler benzersiz değildir. Fakat
benzersiz olarak belirlenir. Fonksiyonların düzgünlüğünü açıklamak için, Fourier özelliklerini düşünelim. Bir çeviri değişmez çekirdek , yani,
yani, çekirdek yalnızca iki argümanın farkına bağlıdır. Gaussian çekirdeği bu özelliğe sahiptir. Let Fourier dönüşümü ifade .k ⟨ φ ( x ) , φ ( y ) ⟩ k k ( x , y ) = K ( X - Y ) k kϕ1(x),ϕ2(x),…k⟨ϕ(x),ϕ(y)⟩kk(x,y)=k(x−y)k^k
Bu Fourier bakış olarak, özellikleri
tarafından verilmektedir . Bu, fonksiyonunuzun özellik gösteriminin
, çekirdeğin Fourer dönüşümü ile bölünmüş Fourier dönüşümü tarafından verildiğini söylüyor . Özelliği temsili olup,
bir
burada . Birisi, çoğaltma özelliğinin elinde bulunduğunu gösterebilir (okuyucular için bir alıştırma).f : = ( ⋯ , f l / √ffkxφ(x)(⋯,√f:=(⋯,f^l/k^l−−√,⋯)fkxϕ(x)i=√(⋯,k^l−−√exp(−ilx),⋯)i=−1−−−√
Her Hilbert uzayında olduğu gibi, uzaya ait tüm elemanların sınırlı bir normları olmalıdır. Bir nin kare normunu düşünelim :f∈H
∥f∥2H=⟨f,f⟩H=∑∞l=−∞f^2lk^l.
Peki bu norm ne zaman sınırlı, yani, uzaya mı ait? Zaman olduğu daha hızlı düşer toplamı meyilli olacak şekilde. Şimdi, bir Gauss çekirdeğinin Fourier dönüşümüf 2 L k l K ( X , Y ) = exp ( - ‖ x - y ‖ 2ff^2lk^l k(x,y)=exp(−∥x−y∥2σ2)
Başka bir Gaussian üstel olarak hızlı azalır . Eğer , bu boşlukta olacaksa, Fourier dönüşümü bile daha hızlı . Bu, işlevin yalnızca yüksek ağırlıklara sahip birkaç düşük frekans bileşenine etkin biçimde sahip olacağı anlamına gelir. Sadece düşük frekanslı bileşenleri olan bir sinyal çok fazla "kıpırdatmaz" değildir. Bu, bir Gauss çekirdeğinin neden pürüzsüz bir işlev verdiğini açıklar.lfkk^llfk
Ekstra: Laplace çekirdeği ne durumda?
Bir Laplace çekirdeği ,
Fourier dönüşümü , üstelden çok daha yavaş düşen bir Cauchy dağılımıdır. Bir Gauss çekirdeğinin Fourier dönüşümünde işlev. Bu, fonksiyonunun daha yüksek frekans bileşenlerine sahip olacağı anlamına gelir . Sonuç olarak, bir Laplace çekirdeği tarafından verilen işlev, bir Gauss çekirdeği tarafından verilenden daha "kaba" dır.k(x,y)=exp(−∥x−y∥σ)f
Gauss çekirdeğinin diğer çekirdeğin sahip olmadığı bir özellik nedir?
Gaussian genişliğinden bağımsız olarak, Gaussian çekirdeğinin “evrensel” olduğu bir özelliktir. Sezgisel olarak, bu sınırlı bir sürekli fonksiyon verilen aracı (rasgele), bir işlev vardır şekilde ve
anlamında yakın ( isteğe bağlı kesinliğe kadar gerekli. Temel olarak, bu Gaussian çekirdeğinin keyfi olarak "güzel" (sınırlı, sürekli) işlevleri yaklaştırabilecek işlevler verdiği anlamına gelir. Gauss ve Laplace çekirdekleri evrenseldir. Örneğin bir polinom çekirdeği değildir.gf∈Hfg∥⋅∥∞)
Neden normu bir Cauchy PDF yoluyla koyup aynı sonuçları beklemiyoruz?
Genel olarak, ortaya çıkan pozitif kesin olduğu sürece istediğiniz her şeyi yapabilirsiniz
. Olumlu kesinlik
için , ve
(doğal sayılar kümesi) . Eğer kesin olumlu değildir, o zaman bir iç ürün alana karşılık gelmez. Tüm analizler kesildi, çünkü daha önce de belirtildiği gibi fonksiyon alanına sahip değilsiniz
. Bununla birlikte, ampirik olarak çalışabilir. Örneğin, hiperbolik tanjant çekirdeği ( bu sayfadaki 7 numaralı sayfaya bakın ).k∑Ni=1∑Nj=1k(xi,xj)αiαj>0αi∈R{xi}Ni=1N∈NkH
k(x,y)=tanh(αx⊤y+c)
sinir ağlarında sigmoid aktivasyon birimlerini taklit etmek için tasarlanan, sadece bazı ve ayarları için kesin bir . Yine de pratikte çalıştığı bildirildi.αc
Peki ya diğer özellikler?
Özelliklerin benzersiz olmadığını söyledim. Gauss çekirdeği için, Mercer genişlemesiyle başka bir dizi özellik de verilmiştir . Ünlü Gaussian süreç kitabının 4.3.1 bölümüne bakınız . Bu durumda, özellikleri değerlendirmeye Hermite polinomları vardır .ϕ(x)x