Eğer problem dışbükey veya yarı-konveks ise, küresel bir minimum değeriniz olacaktır.
Bina sinir ağları sırasındaki dışbükey "yapı taşları" hakkında (Bilgisayar Bilimleri sürümü)
Bence bunlardan bahsedilebilecek birkaç tane var:
max (0, x) - dışbükey ve artan
log-sum-exp - dışbükey ve her parametrede artış
y = Balta afindir ve (A) 'da dışbükeydir, belki azalabilir. y = Axe afindir ve (x) 'deki dışbükeydir, belki azalabilir.
Ne yazık ki (A, x) 'de dışbükey değil çünkü belirsiz ikinci dereceden forma benziyor.
Genel matematik ayrık evrişimi ("normal" ile, tekrarlayan sinyal ile tanımlanmış demek istiyorum) Y = h * X, h veya X değişkeninin afin işlevine benziyor gibi görünüyor. Bu, h değişkeninde veya X değişkeninde bir dışbükeydir. Öyle sanmıyorum çünkü h ve X skaler olduklarında evrişim belirsiz kuadratik forma düşecektir.
max (f, g) - eğer f ve g dışbükey ise o zaman maksimum (f, g) dışbükeydir.
Bir işlevi başka bir yerine koyarsanız ve kompozisyonlar oluşturursanız, o zaman hala dışbükey odada y = h (g (x), q (x)) için hareket edin, ancak h, dışbükey olmalı ve her bir argümanda artmalı (düşmemelidir). ...
Neden dışbükey olmayan sinir ağları:
Evrişimin Y = h * X'in h'de artması gerekmediğini düşünüyorum. Bu nedenle, çekirdek hakkında herhangi bir ek varsayım kullanmazsanız, evrişim uyguladıktan hemen sonra dışbükey optimizasyondan çıkacaksınız. Yani kompozisyon ile hepsi iyi değil .
Ayrıca evrişim ve matris çarpımı, yukarıda belirtildiği gibi çift parametrelerini dikkate alırsanız dışbükey değildir . Yani, matris çarpımında problemler var: parametrelerde dışbükey olmayan bir işlem (A, x)
y = Ax, (A, x) 'te quasiconvex olabilir, ancak ilave varsayımlar da dikkate alınmalıdır.
Lütfen kabul etmiyorsanız veya ek bir sorunuz varsa lütfen bana bildirin. Soru da benim için çok ilginç.
ps max-pooling - max'ı seçmekle aşağı örnekleme olan, afin ön kompozisyonu ile (element bloklarını çekmek için) elementwise max işlemlerinin bazı modifikasyonlarına benziyor ve benim için dışbükey görünüyor.
Diğer sorular hakkında
Hayır, lojistik regresyon dışbükey veya içbükey değil, log-içbükeydir. Bu, logaritmayı uyguladıktan sonra açıklayıcı değişkenlerde içbükey fonksiyonun olacağı anlamına gelir. Yani burada maksimum log-olabilirlik hile harika.
Sadece bir küresel minimum değil ise. Yerel minimumlar arasındaki ilişki hakkında hiçbir şey söylenemez. Veya en azından dışbükey optimizasyon kullanamazsınız ve bunun uzantılarıdır, çünkü bu matematik alanı derinlemesine küçümseyiciye dayanmaktadır.
Belki bu konuda kafanız karışır. Çünkü gerçekten bu tür şemalar yaratan insanlar sadece “bir şeyler” yaparlar ve “bir şeyler” alırlar. Maalesef, dışbükey olmayan optimizasyonla başa çıkmak için mükemmel bir mekanizmaya sahip olmadığımız için (genel olarak).
Ancak, Sinir Ağları'nın yanı sıra doğrusal olmayan en küçük kareler gibi çözülemeyen daha basit şeyler var - https://youtu.be/l1X4tOoIHYo?t=2992 (EE263, L8, 50:10)