MCTS / UCT Uygulamaları


10

MCTS / UCT , keşfedilecek umut verici düğümleri seçmek için bir haydut algoritması kullanan bir oyun ağacı arama yöntemidir. Oyunlar rastgele tamamlanır ve daha fazla kazanç sağlayan düğümler daha yoğun olarak araştırılır. Haydut algoritması, yüksek kazanma oranlarına sahip düğümleri keşfetmek ve bilinmeyen düğümleri keşfetmek arasında bir denge sağlar (ve saf haliyle sezgisel bir değerlendirme işlevi kullanmak zorunda değildir). Bu genel tekniğe dayanan programlar bilgisayar Go'da oldukça şaşırtıcı sonuçlar elde etti .

Haydut güdümlü monte-carlo aramaları başka herhangi bir arama problemine uygulandı mı? Örneğin, MAX-SAT, BKP veya diğer kombinatoryal optimizasyon problemlerine çözümlerin yaklaştırılmasında faydalı bir yaklaşım olabilir mi? Haydut tarzı bir yaklaşımın etkili olup olmayacağını gösteren bir sorunun (yapısal / istatistiksel / vb.) Belirli özellikleri var mı?

Çözüm alanının doğası gereği, haydut yöntemlerine tamamen dirençli olabilecek bilinen deterministik problemler var mı?

Yanıtlar:


7

Bu tam bir cevap değil, bunu MAX-SAT'a uygulamakla ilgili bazı temel gözlemler.

7/8x=0x=1x=0x=17/87/8

7/8N-P7/8Kullandığınız buluşsal yöntem, mükemmel bir şekilde tahmin etseniz bile, geri izlemenin sadece üstel birçok adımdan sonra tatmin edilemez olduğu sonucuna varamayacak hala tatmin edilemez formüller vardır. Çözünürlük kanıtlarının uzunluklarındaki düşük sınırlar bu sonuçları verir. Bir referans:

Pavel Pudlák, Russell Impagliazzo: k-SAT için DLL algoritmaları için alt sınır (ön sürüm). SODA 2000: 128-136



2

Bu son araştırma makalesinde, MCTS'nin Bölüm 7.8'deki oyunlar dışındaki bir dizi arama ve optimizasyon problemine uygulanması listelenmiştir:

http://pubs.doc.ic.ac.uk/survey-mcts-methods/survey-mcts-methods.pdf

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=6145622

Haydut tabanlı yöntemlere tamamen dirençli olan alanlara gelince, herhangi bir elden haberdar değilim. Satranç, MCTS literatüründen, aramaya zarar veren "tuzak devletleri" nedeniyle, ancak muhtemelen bilgisayar satranç oyuncularının o kadar yüksek derecede optimize edilmiş ve iyi olduğu gerçeği nedeniyle, herhangi bir yeni yaklaşımın yapılması muhtemel değildir. onlara bir çentik.

Saygılarımızla, Cameron

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.