Gauss Radyal Temel Fonksiyonu (RBF) ile lineer regresyon yapmak ve Gauss çekirdeği ile lineer regresyon yapmak arasındaki fark nedir?
Gauss Radyal Temel Fonksiyonu (RBF) ile lineer regresyon yapmak ve Gauss çekirdeği ile lineer regresyon yapmak arasındaki fark nedir?
Yanıtlar:
Tek gerçek fark uygulanan düzenlemede. Düzenli bir RBF ağı genellikle ağırlıkların kare normuna dayanan bir ceza kullanır. Çekirdek versiyonu için, ceza tipik olarak çekirdeğin neden olduğu özellik uzayında örtük olarak inşa edilen lineer modelin ağırlıklarının kare normundadır. Bunun temel pratik farkı, RBF ağı için ceza RBF ağının merkezlerine (ve dolayısıyla kullanılan veri örneğine) bağlıyken, RBF çekirdeği için indüklenen özellik alanının, Böylece ceza, parametrelemesinden ziyade modelin işlevi için bir cezadır .
Diğer bir deyişle, her iki model için de
RBF ağ yaklaşımı için eğitim kriteri
RBF çekirdek yöntemi için, ve → w = ∑ ℓ i = 1 α i ϕ ( → x i ) var . Bu araçlar olduğu uyarılan özellik uzayında modelin ağırlıkları, bir kare norm ceza → w ikili parametreleri açısından yazılabilir, → alfa olarak
burada , tüm eğitim modelleri için çekirdeğin ikili değerlendirmelerinin matiksi. Eğitim kriteri o zaman
.
İki model arasındaki tek fark , düzenleme dönemindeki .
Çekirdek yaklaşımının temel teorik avantajı, doğrusal olmayan bir modeli, veri örneğine bağlı olmayan sabit doğrusal olmayan bir dönüşümün ardından doğrusal bir model olarak yorumlamanıza izin vermesidir. Dolayısıyla, doğrusal modeller için var olan herhangi bir istatistiksel öğrenme teorisi otomatik olarak doğrusal olmayan sürüme aktarılır. Bununla birlikte, çekirdek parametrelerini ayarlamaya çalıştığınız anda tüm bunlar bozulur, bu noktada RBF (ve MLP) sinir ağlarında olduğu gibi teorik olarak konuştuğumuz noktaya geri döneriz. Yani teorik avantaj belki de istediğimiz kadar büyük değil.
Performans açısından gerçek bir fark yaratması muhtemel mi? Muhtemelen fazla değil. "Ücretsiz öğle yemeği yok" teoremleri, herhangi bir algoritmanın diğerlerine göre a priori üstünlüğünün olmadığını ve normalleştirmedeki farkın oldukça ince olduğunu gösterir, bu yüzden şüpheniz varsa ikisini de deneyin ve çapraz doğrulamaya göre en iyisini seçin.