«convex» etiketlenmiş sorular


6
Dışbükey problemler için Stokastik Gradyan İnişi'ndeki (SGD) gradyan her zaman global aşırı değeri gösterir mi?
Dışbükey bir maliyet fonksiyonu göz önüne alındığında, optimizasyon için SGD kullanılarak, optimizasyon işlemi sırasında belirli bir noktada bir degradeye (vektör) sahip olacağız. Sorum şu ki, dışbükeydeki noktaya göre, gradyan yalnızca işlevin en hızlı yükseldiği / azaldığı yönü işaret ediyor mu, yoksa gradyan her zaman maliyet işlevinin en uygun / en …

1
Sinir ağlarının maliyet fonksiyonu neden dışbükey değildir?
Burada da benzer bir iş parçacığı var ( Sinir ağının maliyet işlevi dışbükey değil mi? ) Fakat buradaki cevaplardaki noktaları anlayamadım ve bunun tekrar sorulma nedeninin bazı sorunları netleştireceğini umuyorum: I karesi alınmış farkı maliyet fonksiyonunun toplamı kullanıyorum için, sonuçta formun şey optimize am y eğitim aşaması esnasında gerçek etiket …


3
PCA optimizasyonu dışbükey midir?
Temel Bileşen Analizi (PCA) objektif fonksiyonu L2 norm yöntemi hatasını minimize edilir (bölüm 2.12 bakınız burada başka görüş projeksiyonda varyansı maksimize etmeye çalışıyor Biz de burada mükemmel bir yazı var.:. PCA nesnel işlevi nedir ? ). Benim sorum şu ki PCA optimizasyonu dışbükey mi? ( Burada bazı tartışmalar buldum , …

4
Tekrar Ağırlıklı En Küçük Kareler (IRLS) Yöntemi LASSO Modeline Nasıl Uygulanır?
IRLS algoritmasını kullanarak bir lojistik regresyon programladım . Doğru özellikleri otomatik olarak seçmek için bir LASSO cezası uygulamak istiyorum . Her yinelemede aşağıdakiler çözülür: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Let negatif olmayan reel sayı. The Elements bölümünde önerildiği gibi kesmeyi cezalandırmıyorum . İstatistiksel Öğrenme . Zaten sıfır katsayıları için aynen. Aksi takdirde, sağ …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.