GPU (CUDA) ile ilgili bazı kısıtlanmamış doğrusal olmayan optimizasyon sorunlarını çözmeye çalışıyorum.
Objektif fonksiyon, doğrusal olmayan düzgün bir fonksiyondur ve gradyanı analitik olarak hesaplamak için nispeten ucuzdur, bu yüzden sayısal yaklaşımla uğraşmak zorunda değilim.
Bu sorunu çoğunlukla fp32 matematik ops (çeşitli nedenlerle) ile çözmek istiyorum, bu yüzden hangi doğrusal olmayan optimizasyon yöntemi iyi performans varken yuvarlama hatalarına karşı daha sağlam? (örneğin eşlenik gradyan / yarı newton / güven bölgesi), GPU'da BFGS'yi iyi sonuçlarla deneyen var mı?
Hessian BTW, gerekirse benim durumumda nispeten küçüktür (tipik olarak <64x64), ancak binlerce küçük ölçekli optimizasyon problemini aynı anda çözmem gerekiyor.