Doğrusal regresyonda kullanılacak Gauss Temeli fonksiyon parametrelerini anlama


12

Gauss temel işlevini doğrusal regresyon uygulamasına uygulamak istiyorum. Ne yazık ki temel işlevi birkaç parametreleri anlamakta zorlanıyorum. Özellikle ve .σμσ

Veri setim 10.000 x 31 bir matristir. 10.000 örnek ve 31 özellik. Ben okudum "Her temel işlevi giriş vektörü x skaler bir değere dönüştürür". Bu yüzden x'in 1 örnek olduğunu varsayıyorum, böylece 1 x 31 vektör. Buradan kafam karıştı. μj parametresi tam olarak nedir ? Bunun temel fonksiyonların konumlarını yönettiğini okudum. Peki bu bir şeyin anlamı değil mi? Ben de j ( μ ve ϕ ) altyazısı tarafından atıyorum , bu beni jth satır düşündürüyor. Ama bu mantıklı gelmiyor. Mı μj bir vektör? Şimdi σ"mekansal ölçeği yönetir". Tam olarak nedir? Bu parametre için .1, .5, 2.5 gibi değerleri deneyen bazı uygulamalar gördüm. Bu değerler nasıl hesaplanır? Araştırma yapıyorum ve öğrenmeye örnekler arıyordum ama henüz hiçbir şey bulamadım. Herhangi bir yardım veya yön büyük takdir! Teşekkür ederim.

Yanıtlar:


11

Kafanız karıştığında, sorunu belirterek ve sorularınızı tek tek alarak başlamama izin verin. 10.000 örnek boyutunuz var ve her örnek özellik vektörü ile açıklanıyor . Gauss radyal temel işlevlerini kullanarak regresyon yapmak istiyorsanız, f ( x ) = j w jg j ( x ; μ j , σ j ) , j = 1 .. m formunun bir işlevini arıyorsunuz . g benxR31

f(x)=jwjgj(x;μj,σj),j=1..m
gitemel işlevlerinizdir. Özellikle, bulmalıyız ağırlıkları w j verilen parametreler için çok μ j ve σ j Eğer arasındaki hatayı en aza indirmek y ve karşılık gelen tahmini y = f ( x ) - genellikle en küçük kareler hata en aza indirecektir.mwjμjσjyy^f(x^)

Mu abone j parametresi tam olarak nedir?

temel fonksiyonlarını bulmanız gerekir g j . (Hala m sayısını belirlemeniz gerekir ) Her temel fonksiyonun μ j ve σ j (ayrıca bilinmiyor) olacaktır. Alt simge j arasında değişmektedir 1 için m .mgjmμjσjj1m

bir vektör?μj

Evet, bir nokta . Başka bir deyişle, özellik alanınızda bir yere işaret eder ve m temeli işlevlerinin her biri için bir μ belirlenmelidir .R31μm

Bunun temel fonksiyonların konumlarını yönettiğini okudum. Peki bu bir şeyin anlamı değil mi?

baz fonksiyonu merkezlenmiş μ j . Bu konumların nerede olduğuna karar vermeniz gerekecek. Yani hayır, mutlaka bir şeyin anlamı değildir (ancak onu belirleme yolları için aşağıya bakın)jthμj

Şimdi "mekansal ölçeği yöneten" sigma için. Tam olarak nedir?

, temel fonksiyonların kendilerine dönersek anlamak daha kolaydır.σ

R1R2R1σσσσσ

Bunun amacının ne olduğunu sorabilirsiniz. Alanın bir kısmını kaplayan zili düşünüyorsanız ( bir çizgi ) - dar bir zil çizginin sadece küçük bir kısmını kaplayacaktır *. Zilin merkezine yakın olan x noktaları daha büyük bir g j ( x ) değerine sahip olacaktır. Merkezden uzak olan noktaların g j ( x ) değeri daha küçük olacaktır . Ölçekleme noktaları merkezden uzağa itme etkisine sahiptir - zil noktaları merkezden daha da uzağa yerleştirileceği için g j ( x ) değerini azaltırR1xgj(x)gj(x)gj(x)

Her temel fonksiyon, giriş vektörü x'i skaler bir değere dönüştürür

Evet, noktasındaki temel fonksiyonları değerlendiriyorsunuz .xR31

exp(xμj222σj2)

Sonuç olarak bir skaler elde edersiniz. Skaler sonuç, noktasının tarafından verilen merkezinden uzaklığına bağlıdır. ve skaler .μ jx - μ jσ jxμjxμjσj

Bu parametre için .1, .5, 2.5 gibi değerleri deneyen bazı uygulamalar gördüm. Bu değerler nasıl hesaplanır?

Bu elbette Gauss radyal temel işlevlerini kullanmanın ilginç ve zor yönlerinden biridir. Web'de arama yaparsanız, bu parametrelerin nasıl belirlendiğine ilişkin birçok öneri bulacaksınız. Kümelemeye dayalı bir olasılık çok basit terimlerle özetleyeceğim. Bunu ve diğer birkaç öneriyi çevrimiçi olarak bulabilirsiniz.

10000 örneğinizi kümeleyerek başlayın (önce boyutları azaltmak için PCA kullanabilirsiniz, ardından k-Means kümeleme). Sen sağlayabilirsiniz (bu genellikle iyi belirlemek için çapraz doğrulama istihdam bulmak küme sayı ). Şimdi, her küme için radyal temel işlevi oluşturun. Her radyal temel işlevi için merkezi olsun (örneğin ortalama, centroid, vb.). Let (örn yarıçap ...) Şimdi devam edin ve regresyon gerçekleştirmek küme genişliğini yansıtır (bu basit tanım o her adımda bir sürü şey var sadece Genel bakış- değildir!)m g j μ j σ jmmgjμjσj

* Tabii ki, çan eğrisi elde tanımlanır - için böylece on line her yerde değerine sahip olacaktır. Ancak, merkezden uzak değerler ihmal edilebilir


Güzel cevap! Ancak, araması , destek vektör makinesi regresyonunu (gauss çekirdeği ile) bitirmiyoruz mu? μ
O_Devinyak

@ O_Devinyak- Birçok temel genişletme yöntemi bir tür parametre tahmini gerektirecektir. bulmak için birçok yolu vardır, bu yüzden bu mutlaka SVR için sorunu azaltmak anlamına gelir sanmıyorum. Dürüst olmak gerekirse, ben SVR konusunda bir uzman değilim ama en aza indirilmiş kayıp fonksiyonu kesinlikle farklı ve birçok özellik göz ardı eminim - bu Destek Vektör yolu. Temel işlevlerde, değerlendirme için tüm işlevleri kullanırız, ancak neyse ki kompakt destek, temel işlevlerin çoğunun ihmal edilebilir veya sıfır değerler döndürdüğü anlamına gelir. Her neyse, bu forumda iyi bir soru olurduμ
martino

Neden temel fonksiyonun çok değişkenli bir Gaussian'ın üstel kısmı gibi görünmesini sağlayacak bir kovaryans matrisi yerine ölçeğine ihtiyacımız var ? σj
yığın akışı

1

Basit bir açıklama yapmaya çalışayım. Böyle bir gösterimde satır numarası olabilir, ancak özellik numarası da olabilir. Biz geç ise daha sonra O anlamına gelir, sayı bulunur sütun vektördür isimli skaler ve bir sütun -vektör. Biz geç ise daha sonra belirtmektedir satır numarasını, skalerdir, kolon vektörü ve bir bir sıra vektör. Notasyonu satır ve belirtmektedir O anlamına gelir sütun daha yaygındır, bu nedenle bize ilk varyant kullanın.y = β 0 + j = 1 : 31 β j ϕ j ( x ) j y β j ϕ j ( x ) y j = β ϕ j ( x ) j y j β ϕ j ( x ) i jjy=β0+j=1:31βjϕj(x)jyβjϕj(x)yj=βϕj(x)jyjβϕj(x)ij

Gauss temel fonksiyonunu lineer regresyona (skaler) şimdi (vektör) özelliklerinin sayısal değerlerine değil, ile diğer tüm noktaların merkezi arasındaki mesafelere bağlıdır . Bu şekilde , inci gözlemin özellik özellik değerinin yüksek veya küçük olmasına bağlı değildir, ancak özellik özellik değerinin bu -feature ortalamasına yakın veya uzak olmasına bağlıdır. . Bu yüzden için bir parametre değildir. Sadece bir veri kümesinin bir özelliğidir. parametresix i x i μ i y i j i j j μ i j μ j σ 2yixixiμiyijijjμijμjσ2skaler bir değerdir, pürüzsüzlüğü kontrol eder ve ayarlanabilir. Eğer küçükse, uzaklıktaki küçük değişiklikler büyük etkiye sahip olacaktır (dik gaussyanı hatırlayın: merkezden zaten küçük mesafede bulunan tüm noktaların küçük değerleri vardır). Büyükse, mesafedeki küçük değişiklikler düşük etkiye sahip olacaktır (düz gaussyanı hatırlayın: azalmasıyyσ2


0

xR31μjR31e(xμj)Σj1(xμj)ΣjR31×31jjΣjj

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.