«multiarmed-bandit» etiketlenmiş sorular


4
Ne tür gerçek yaşam durumlarında çok kollu bir haydut algoritması kullanabiliriz?
Çok kollu haydutlar, seçenekleriniz olduğu ve hangisinin sağlığınızı en üst düzeye çıkaracağından emin olmadığınız durumlarda iyi çalışır. Algoritmayı bazı gerçek yaşam durumları için kullanabilirsiniz. Örnek olarak, öğrenme iyi bir alan olabilir: Bir çocuk marangozluk öğreniyorsa ve bu konuda kötü ise, algoritma ona muhtemelen devam etmesi gerektiğini söyleyecektir. Eğer bu konuda …

1
Bağlamsal haydutlar için maliyet fonksiyonları
Bağlamsal bir haydut sorunu çözmek için vowpal wabbit kullanıyorum . Kullanıcılara reklamları gösteriyorum ve reklamın gösterildiği bağlam hakkında oldukça fazla bilgiye sahibim (ör. Kullanıcının kim olduğu, hangi sitede olduğu vb.). Bu, John Langford tarafından tarif edildiği gibi oldukça klasik bir bağlamsal eşkıya sorunu gibi görünüyor . Benim durumumda, bir kullanıcının …

2
Layman'ın terimleriyle Thompson Sampling nedir?
Thompson Sampling'i ve nasıl çalıştığını anlayamıyorum . Multi Arm Bandit hakkında okuyordum ve Üst Güven Sınırlı Algoritmayı okuduktan sonra, birçok metin Thompson Sampling'in UCB'den daha iyi performans gösterdiğini öne sürdü. Layman'ın ya da basit bir ifadeyle Thompson Sampling nedir? Daha fazla bilgi için referans makaleler sunmaktan çekinmeyin.

1
N-kollu haydut problemlerini çözmek için en uygun algoritma?
Ben n-silahlı haydut sorunları çözmek için bir dizi algoritmalar hakkında okudum εϵ\epsilon-gözlü, softmax ve UCB1, ama pişmanlığı en aza indirmek için hangi yaklaşımın en iyi olduğunu sıralamakta biraz sorun yaşıyorum. N-kollu haydut problemini çözmek için bilinen bir optimal algoritma var mı? Uygulamada en iyi performansı gösteren algoritma seçeneği var mı?

1
Genel ödül dağıtımı için çok kollu haydut
Ödül dağılımı hakkında herhangi bir bilgimizin olmadığı çok kollu bir haydut sorunu üzerinde çalışıyorum. Bilinen bağlı bir dağıtım ve destekli genel dağıtımlar için pişmanlık sınırlarını garanti eden birçok makale buldum [0,1]. Ödül dağıtımının desteği konusunda garantisi olmayan bir ortamda iyi performans göstermenin bir yolu olup olmadığını öğrenmek istiyorum. Parametrik olmayan …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.