N-kollu haydut problemlerini çözmek için en uygun algoritma?


13

Ben n-silahlı haydut sorunları çözmek için bir dizi algoritmalar hakkında okudum ϵ-gözlü, softmax ve UCB1, ama pişmanlığı en aza indirmek için hangi yaklaşımın en iyi olduğunu sıralamakta biraz sorun yaşıyorum.

N-kollu haydut problemini çözmek için bilinen bir optimal algoritma var mı? Uygulamada en iyi performansı gösteren algoritma seçeneği var mı?


Muhtemelen tanınmış bir optimum çözüm yoktur, aksi takdirde Wikipedia sayfası bunu söyler ve deneysel bir Sourceforge sayfası olmaz
Henry,

Bu Teorik Bilgisayar Bilimi SE'de olmamalı mı?

1
@mbq takviye öğrenme makine öğreniminin bir dalı olduğundan, sanmıyorum;)
steffen

@steffen Elbette, ad "tcsy" gibiydi.

@mbq Anlamıyorum. "Tscy" ne anlama geliyor?
steffen

Yanıtlar:


9

İşte son zamanlarda bulduğum iki anket belgesi. Henüz okumadım ama özetler kulağa umut verici geliyor.

Joann'ın Vermorel ve Mehryar Mohri: Çok Silahlı Haydut Algoritmaları ve Ampirik Değerlendirme (2005)

Özetden:

Bir kumarbaz için çok kollu haydut sorunu, bir dizi denemede toplam ödülünü en üst düzeye çıkarmak için bir K slot makinesinin hangi kolunu çekeceğine karar vermektir. Birçok gerçek dünya öğrenme ve optimizasyon problemi bu şekilde modellenebilir. Son yirmi yılda bu soruna bir çözüm olarak çeşitli stratejiler veya algoritmalar önerilmiştir, ancak bilgimize göre, bu algoritmaların ortak bir değerlendirmesi yapılmamıştır.

Volodymyr Kuleshov ve Doina Precup: Çok kollu haydut problemi için algoritmalar (2000)

İkincisi, çoğu algoritmanın performansı eşkıya sorununun parametrelerine göre önemli ölçüde değişir. Çalışmamız her algoritma için iyi performans gösterdiği ayarları ve düşük performans gösterdiği ayarları tanımlar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.