(Notları düzenle: Uzunluğunda çıldırdıktan sonra yeniden düzenledim.)
Koordinat inişine ilişkin literatürün izini bulmak biraz zor olabilir. İşte bunun bazı nedenleri.
lp
Adlandırma standart değildir. "En dik iniş" terimi bile standart değildir. "Döngüsel koordinat inişi", "koordinat inişi", "Gauss-Seidel", "Gauss-Southwell" terimlerinden herhangi birinde başarılı olabilirsiniz. kullanımı tutarlı değil.
nn
O (ln( 1 / ϵ ) )lp
Kısıtlamalar. Güçlü dışbükeylik olmadan, biraz dikkatli olmaya başlamanız gerekir. Kısıtlamalar hakkında hiçbir şey söylemediniz ve bu nedenle genel olarak sonsuzluğa ulaşılamayabilir. Kısıtlamalar konusunda kısaca söyleyeceğim, standart yaklaşımın (iniş yöntemleri ile) kısıtlamanıza yansıtmak, fizibiliteyi korumak için her bir yinelemeyi ayarlamak veya kısıtlamaları objektif işlevinize getirmek için engelleri kullanmaktır. Birincisi durumunda, koordinat inişiyle nasıl oynadığını bilmiyorum; ikincisi durumunda, koordinat inişi ile iyi çalışır ve bu engeller güçlü bir şekilde dışbükey olabilir.
Daha spesifik olarak koordinat yöntemlerine, projeksiyon yapmaktan ziyade, birçok kişi sadece koordinat güncellemesinin fizibilitesini sürdürmesini sağlar: örneğin, Frank-Wolfe algoritması ve varyantlarında (yani, SDP'leri çözmek için kullanmak).
SVM'ler için SMO algoritmasının, aynı anda iki değişkeni güncellediğiniz ve bunu yaparken bir fizibilite kısıtlamasını koruduğunuz bir koordinat iniş yöntemi olarak görüntülenebileceğini de kısaca not edeceğim. Değişkenlerin seçimi bu yöntemde sezgiseldir ve bu nedenle garantiler gerçekten sadece döngüsel garantilerdir. Bu bağlantının standart literatürde görünüp görünmediğinden emin değilim; SMO yöntemini Andrew Ng'nin ders notlarından öğrendim ve oldukça temiz olduklarını gördüm.
n
O (ln( 1 / ϵ ) )
Koordinat inişinde daha yeni sonuçlar var, arXiv'de bir şeyler gördüm. Ayrıca, luo & tseng bazı yeni kağıtlar var. ama asıl mesele bu.
∑mi=1g(⟨ai,λ⟩)g(ai)m1λexp(1/ϵ2)O(1/ϵ)
Kesin güncellemelerle ilgili sorun. Ayrıca, kapalı formda tek bir koordinat güncellemesine sahip olmamanız genellikle söz konusudur. Ya da kesin çözüm basitçe mevcut olmayabilir. Ama neyse ki, temel olarak kesin bir çözümle aynı garantileri alan çok sayıda çizgi arama yöntemi var. Bu materyal standart doğrusal olmayan programlama metinlerinde, örneğin yukarıda belirtilen Bertsekas veya Nocedal & Wright kitaplarında bulunabilir.
İkinci paragrafınıza bir göz atın: bunlar iyi çalıştığında.
İlk olarak, yukarıda bahsedilen koordinat inişine yönelik gradyan çalışması için analizlerin çoğu. Öyleyse neden her zaman koordinat inişini kullanmıyorsunuz? Cevap, gradyan inişinin uygulanabilir olduğu birçok sorun için, üstün yakınsamanın kanıtlanabileceği Newton yöntemlerini de kullanabilirsiniz. Koordinat inişiyle Newton avantajını elde etmenin bir yolunu bilmiyorum. Ayrıca, Newton yöntemlerinin yüksek maliyeti Quasinewton güncellemeleriyle azaltılabilir (örneğin, bkz. LBFGS).
l0kkkkf