Küresel olarak optimize edilebilir bir maliyet fonksiyonu formüle ederek bir probleme yaklaşmanın avantajları


9

Bu oldukça genel bir sorudur (yani istatistiklere özgü olması gerekmez), ancak yazarların aşağıdaki yaklaşımı izlemeyi tercih ettiği makine öğrenimi ve istatistiksel literatürde bir eğilim fark ettim:

Yaklaşım 1 : Küresel olarak optimal bir çözüm bulmanın mümkün olduğu bir maliyet fonksiyonunu formüle ederek (örn. Dışbükey bir maliyet fonksiyonunu formüle ederek) pratik bir soruna bir çözüm elde edin.

ziyade:

Yaklaşım 2 : Küresel olarak optimal bir çözüm elde edemeyeceğimiz bir maliyet fonksiyonu formüle ederek aynı soruna bir çözüm elde edin (örneğin, bunun için sadece yerel olarak optimal bir çözüm elde edebiliriz).

İki sorunun titizlikle ifade edilmesinin farklı olduğunu unutmayın; varsayım, birincisi için küresel olarak en uygun çözümü bulabileceğimiz, ikincisi için bulamayacağımızdır.

Diğer hususlar bir yana (yani hız, uygulama kolaylığı, vb.), Arıyorum:

  1. Bu eğilimin bir açıklaması (örneğin, matematiksel veya tarihsel argümanlar)
  2. Pratik bir sorunu çözerken 2 yerine Yaklaşım 1'i takip etmenin faydaları (pratik ve / veya teorik).

Yanıtlar:


3

İnanıyorum ki amaç ilgilendiğiniz işlevi optimize etmek olmalıdır. Eğer bu bir binomial olasılık değil, yanlış sınıflandırmaların sayısı ise, o zaman yanlış sınıflandırma sayısını en aza indirmeye çalışmalısınız. Bununla birlikte, bahsedilen pratik nedenlerin sayısı (hız, uygulama, kararsızlık vb.) Nedeniyle, bu o kadar kolay olmayabilir ve hatta imkansız olabilir. Bu durumda, çözümü yaklaşık olarak seçmeyi tercih ederiz.

Temel olarak iki yaklaşım stratejisi biliyorum; ya orijinal sorunun çözümüne doğrudan yaklaşmaya çalışan algoritmalar buluyoruz ya da orijinal sorunu daha doğrudan çözülebilir bir sorun olarak yeniden biçimlendiriyoruz (örn. konveks gevşeme).

Bir yaklaşımı diğerine tercih etmenin matematiksel bir argümanı, a) gerçekte hesaplanan çözümün özelliklerini ve b) çözümün gerçekten ilgilendiğimiz sorunun çözümüne ne kadar yaklaştığını anlayabiliyor muyuz.

Optimizasyon problemine bir çözümün özelliklerini kanıtlayabildiğimiz istatistiklerde birçok sonuç biliyorum. Bana göre, hesapladığı şeyin matematiksel bir formülasyonuna sahip olmadığınız bir algoritmanın çözümünü analiz etmek daha zor görünüyor (örneğin, belirli bir optimizasyon problemini çözdüğü gibi). Kesinlikle yapamayacağınızı iddia etmeyeceğim, ancak hesapladığınız şeyin net bir matematiksel formülasyonunu verebilmeniz teorik bir fayda gibi görünüyor .

Bu matematiksel argümanların Yaklaşım 2 üzerinden Yaklaşım 1'e herhangi bir pratik fayda sağlayıp sağlamadığı net değil . Dışbükey olmayan bir kayıp fonksiyonundan korkmayan birileri kesinlikle var .


Yann LeCun'un konuşmasına referans için teşekkürler. İzlemeyi dört gözle bekliyorum.
Amelio Vazquez-Reina

1

@NRH bu soruya bir cevap verdi (5 yıl önce), bu yüzden sadece Yaklaşım 1 ve 2'yi birleştiren bir Yaklaşım 3 sunacağım.

Yaklaşım 3 :

  1. Bir dışbükey veya herhangi bir durumda, küresel olarak optimize edilebilir (mutlaka dışbükey değil), gerçekten çözmek istediğiniz soruna "yakın" olan problemi formüle edin ve çözün.
  2. Gerçekten çözmek istediğiniz dışbükey olmayan bir optimizasyon problemine başlangıç ​​(başlangıç) çözümü olarak 1. adımdaki global olarak en uygun çözümü kullanın (veya 1. adımda çözülen sorundan daha fazla çözmek istediğiniz). Başlangıç ​​çözümünüzün, gerçekten çözmek istediğiniz dışbükey olmayan optimizasyon problemini çözmek için kullanılan çözüm yöntemine göre küresel optimum "cazibe bölgesinde" olduğunu umuyoruz.

Lütfen somut bir örnek veriniz.
horaceT

Tam olarak Mark'ın durumu değildir, ancak birçok bilgisayar görme probleminde ortak bir yaklaşım , ilgili problemler hakkında bir dizi "iyi" yerel optima elde etmek için dereceli dışbükeylik kullanmaktır . Somut bir örnek, bir çift görüntü için, bir çift görüntü piramidi boyunca hareket ederek daha ince ölçeklerde araştırmayı tohumlamak için kaba ölçekli bir hizalamanın kullanıldığı kaba ila ince optik akıştır .
GeoMatt22

@horaceT Diyelim ki dışbükey olmayan doğrusal olmayan en küçük kareler problemini çözmek için ~ . Adım 1 olarak, dışbükey olan ve küresel optimumluğa çözülebilen doğrusal en küçük kareler problemini ~ çözebilirsiniz. Sonra adım 2'de doğrusal olmayan en küçük kareler için başlangıç ​​değerleri olarak . Sorunlar benzer, ancak hatalar farklı şekilde ele alınır. Dışbükey olmayan bir cezanın istendiği (adım 2 için) birçok sorun vardır, ancak adım 1 için dışbükey ceza ile değiştirilebilir. Birden fazla tekrarlama da mümkündür. yaebxyaa+bbxa=eaaoptimal,b=bboptimal
Mark L. Stone

@ GeoMatt22 Açıkladığınız şey ruh olarak benzerdir ve gerçekten çözmek istediğiniz sorunun çözümüne giden bir yolun, örneğin bir parametrenin, bir kısıtlama bağlı, kademeli olarak değiştirilir ve ilk problemin sıfırdan çözülmesi kolay olan ardışık problemler çözülür. Gerçekten de ilk sorunun dışbükey olması veya çözüme başka bir şekilde uygun olması söz konusu olabilir, ancak daha sonraki sorunlar parametrede en iyi çözümlerinin sürekli olmasına rağmen olmayabilir.
Mark L. Stone
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.