Bilinmeyen gürültülü işlevi en üst düzeye çıkarma


10

Ben bir işlev maksimize ilgilenen kulüpler , burada θ R s .f(θ)θRp

Sorun, fonksiyonun veya türevlerinin analitik formunu bilmememdir. Yapabileceğim tek şey bir değer takarak, nokta-bilge işlevini değerlendirmektir Bir GÜRÜLTÜCÜ tahmin ve almak f ( θ * ) bu noktada. İstersem bu tahminlerin değişkenliğini azaltabilirim, ancak artan hesaplama maliyetlerini ödemek zorundayım. θf^(θ)

İşte şimdiye kadar denedim:

  • Sonlu farklarla stokastik en dik iniş: işe yarayabilir, ancak çok fazla ayar gerektirir (örneğin kazanç dizisi, ölçeklendirme faktörü) ve genellikle çok kararsızdır.

  • Simüle edilmiş tavlama: Çalışır ve güvenilirdir, ancak birçok fonksiyon değerlendirmesi gerektirir, bu yüzden oldukça yavaş buldum.

Bu yüzden bu koşullar altında çalışabilecek olası alternatif optimizasyon yöntemi hakkında öneri / fikir istiyorum. Benimkinden farklı araştırma alanlarından gelen önerileri teşvik etmek için sorunu olabildiğince genel tutuyorum. Yakınsamada Hessian hakkında bir tahmin verebilecek bir yönteme çok ilgi duyacağımı da eklemeliyim. Bunun nedeni, parametrelerin belirsizliğini tahmin etmek için kullanabilmemdir . Aksi takdirde, bir tahmin elde etmek için maksimumda sonlu farklar kullanmak zorunda kalacağım.θ


İşlevinizin çıktısıyla ilişkili gürültü hakkında daha spesifik bir şey söyleyemiyorsanız, benzetilmiş tavlamadan daha karmaşık bir şey olduğundan emin değilim (bunu bir dereceye kadar ayarlamanız gerekecek), yardımcı olacaktır.
Aron Ahmadia

θ

f^(θ)N(f(θ),σ)

Neumaier :)
Aron Ahmadia

Burada fizikçiler, oldukça gürültülü optik faz şekillendirme (lazer puls fazını bir pulshaper ile optimize etmek) için CMA-ES kullandım.
12'de 2

Yanıtlar:


7

Matlab paketimiz SnobFit tam da bu amaçla oluşturuldu. Gürültünün dağılımı hakkında herhangi bir varsayım gerekli değildir. Ayrıca, işlev değerleri metin dosyaları aracılığıyla sağlanabilir, böylece bir metin dosyası yazabilen herhangi bir sistemde uygulanan işlevlere uygulayabilirsiniz. Bkz.
Http://www.mat.univie.ac.at/~neum/software/snobfit/

SnobFit, optimize edilecek fonksiyonun mevcut olmadığı bir uygulama için geliştirilmiş ve örnek ürünler yaratan ve bunları elle ölçen, yaklaşık 50 fonksiyona neden olan özel, pahalı ekipmanlarla fonksiyon değerleri (üretim kalitesinin bir ölçüsü) elde edilmiştir. günlük değerlendirmeler.


Cevabınız için çok teşekkür ederim. SnobFit paketiyle ilgili makalenizi okumaya başladım ve gerçekten ilginç buluyorum. Ayrıca, makalenizin tanıtımını okurken, (istatistiksel bağlamda) uğraştığım problemin endüstriyel matematikte oldukça sık olduğunu fark ettim. Tamamen farkında olmadığım geniş bir literatür var. Aslında üzerinde çalıştığım yaklaşım Powell'ın kuadratik yaklaşımına biraz benziyor (2002).
Jugurtha

Snobfit 128 serbestlik derecesi ile iyi çalışır mı? Sadece benim durumum için denemeye değer olduğunu bilmek.
12'de 2

@tillsten: Çok sayıda işlev değeri harcayamazsanız gürültülü sorun için hiçbir yöntem 128 dof ile iyi sonuç vermez. VXQR1'imizi deneyebilirsiniz, bu da gürültülü problemler için değildir, ancak bazen gürültülü problemleri iyi işler.
Arnold Neumaier

Snobfit için sınır yaklaşık 20 değişkendir. Daha fazlasına sahipseniz, sırayla kısmen optimize ettiğiniz 20 değişkenli sağduyu gruplarını seçmeniz gerekir. Veya boyutun küçültülmesi için bazı değişkenlerin aynı anda kaydırılmasına izin verebilirsiniz.
Arnold Neumaier

7

Deneyebileceğiniz birkaç Bayes optimizasyon tekniği vardır. En kolayı Gauss sürecine dayanır:

  • Harold J. Kushner. Gürültü varlığında keyfi bir çoklu tepe eğrisinin maksimumunu bulmak için yeni bir yöntem. Temel Mühendislik Dergisi, sayfa 86: 97-106, Mart 1964.
  • J. Mockus. Küresel optimizasyona Bayesci yaklaşım. Kontrol ve Bilgi Bilimleri Ders Notları, 38: 473–481, 1982.
  • Niranjan Srinivas, Andreas Krause, Sham Kakade ve Matthias Seeger. Haydut ortamında Gauss süreç optimizasyonu: Pişmanlık ve deneysel tasarım yok. Proc. Uluslararası Makine Öğrenimi Konferansı (ICML), 2010.
  • Andreas Krause, Ajit Singh ve Carlos Guestrin. Gauss süreçlerinde Optimal'e yakın sensör yerleşimleri: Teori, verimli algoritmalar ve ampirik çalışmalar. J. Mach. Öğrenin. Res., 9: 235-284, Haziran 2008.

Şimdiye kadar gözlemler vermek için makul bir fonksiyonlar üzerinde bir posterior oluşturarak çalışırlar ve işlevi hızlı bir şekilde öğrenmek ve küresel maksimumları bulmak için bir sonraki noktayı önerirler ( blog yazıma bakın ).

Başka bir avantaj da Hessian'ı maksimuma göre tahmin edebilmenizdir. Ancak, bir gürültü modeli belirtmeniz gerekir.


4

James Spall'un SPSA algoritması (doğru hatırlıyorsam Stokastik Pertürbasyon Simüle Tavlama kısaltması) tam olarak bu tür bir problem için tasarlanmıştır. Açıkladığınız gibi problemler için kullandığı birkaç kağıdı var.


Spall'ın en dik iniş ve Raphson Newton'un stokastik bir versiyonuna dayanan yaklaşımını denedim. Benzetimli Tavlama'yı denedim, ancak Spall tarafından önerilen sürüm değil, denemeliyim. Benzetimli tavlama konusunda gerçekten hevesli değilim, çünkü yakınsamada Hessian hakkında bir tahmin alamıyorum (örneğin, stokastik Raphson Newton ile Hessian'a "ücretsiz" bir yaklaşım alabilirim).
Jugurtha
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.