Kafanız karıştığında, sorunu belirterek ve sorularınızı tek tek alarak başlamama izin verin. 10.000 örnek boyutunuz var ve her örnek özellik vektörü ile açıklanıyor . Gauss radyal temel işlevlerini kullanarak regresyon yapmak istiyorsanız, f ( x ) = ∑ j w j ∗ g j ( x ; μ j , σ j ) , j = 1 .. m formunun bir işlevini arıyorsunuz . g benx∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gitemel işlevlerinizdir. Özellikle, bulmalıyız
ağırlıkları
w j verilen parametreler için çok
μ j ve
σ j Eğer arasındaki hatayı en aza indirmek
y ve karşılık gelen tahmini
y =
f ( x ) - genellikle en küçük kareler hata en aza indirecektir.
mwjμjσjyy^f(x^)
Mu abone j parametresi tam olarak nedir?
temel fonksiyonlarını bulmanız gerekir g j . (Hala m sayısını belirlemeniz gerekir ) Her temel fonksiyonun μ j ve σ j (ayrıca bilinmiyor) olacaktır. Alt simge j arasında değişmektedir 1 için m .mgjmμjσjj1m
Mı bir vektör?μj
Evet, bir nokta . Başka bir deyişle, özellik alanınızda bir yere işaret eder ve m temeli işlevlerinin her biri için bir μ belirlenmelidir .R31μm
Bunun temel fonksiyonların konumlarını yönettiğini okudum. Peki bu bir şeyin anlamı değil mi?
baz fonksiyonu merkezlenmiş μ j . Bu konumların nerede olduğuna karar vermeniz gerekecek. Yani hayır, mutlaka bir şeyin anlamı değildir (ancak onu belirleme yolları için aşağıya bakın)jthμj
Şimdi "mekansal ölçeği yöneten" sigma için. Tam olarak nedir?
, temel fonksiyonların kendilerine dönersek anlamak daha kolaydır.σ
R1R2R1σσσσσ
Bunun amacının ne olduğunu sorabilirsiniz. Alanın bir kısmını kaplayan zili düşünüyorsanız ( bir çizgi ) - dar bir zil çizginin sadece küçük bir kısmını kaplayacaktır *. Zilin merkezine yakın olan x noktaları daha büyük bir g j ( x ) değerine sahip olacaktır. Merkezden uzak olan noktaların g j ( x ) değeri daha küçük olacaktır . Ölçekleme noktaları merkezden uzağa itme etkisine sahiptir - zil noktaları merkezden daha da uzağa yerleştirileceği için g j ( x ) değerini azaltırR1xgj(x)gj(x)gj(x)
Her temel fonksiyon, giriş vektörü x'i skaler bir değere dönüştürür
Evet, noktasındaki temel fonksiyonları değerlendiriyorsunuz .x∈R31
exp(−∥x−μj∥222∗σ2j)
Sonuç olarak bir skaler elde edersiniz. Skaler sonuç, noktasının tarafından verilen merkezinden uzaklığına bağlıdır. ve skaler .μ j ‖ x - μ j ‖ σ jxμj∥x−μj∥σj
Bu parametre için .1, .5, 2.5 gibi değerleri deneyen bazı uygulamalar gördüm. Bu değerler nasıl hesaplanır?
Bu elbette Gauss radyal temel işlevlerini kullanmanın ilginç ve zor yönlerinden biridir. Web'de arama yaparsanız, bu parametrelerin nasıl belirlendiğine ilişkin birçok öneri bulacaksınız. Kümelemeye dayalı bir olasılık çok basit terimlerle özetleyeceğim. Bunu ve diğer birkaç öneriyi çevrimiçi olarak bulabilirsiniz.
10000 örneğinizi kümeleyerek başlayın (önce boyutları azaltmak için PCA kullanabilirsiniz, ardından k-Means kümeleme). Sen sağlayabilirsiniz (bu genellikle iyi belirlemek için çapraz doğrulama istihdam bulmak küme sayı ). Şimdi, her küme için radyal temel işlevi oluşturun. Her radyal temel işlevi için merkezi olsun (örneğin ortalama, centroid, vb.). Let (örn yarıçap ...) Şimdi devam edin ve regresyon gerçekleştirmek küme genişliğini yansıtır (bu basit tanım o her adımda bir sürü şey var sadece Genel bakış- değildir!)m g j μ j σ jmmgjμjσj
* Tabii ki, çan eğrisi elde tanımlanır - için böylece on line her yerde değerine sahip olacaktır. Ancak, merkezden uzak değerler ihmal edilebilir∞∞∞