NN + MCTS & AB + el yazısıyla yazılmış değerlendirme neden motor satrancına egemendir?


14

Anladığım kadarıyla motorlar şu anda dört gruba ayrılabilir: Alpha-beta (AB) + arama için Monte Carlo Ağacı Arama'yı (MCTS) kullanan ve el yazısı işlevleri kullanan + sinir ağları kullanan eval. En güçlü iki motor Leela ve Stockish. Leela MCTS + NN kullanırken Stockish AB + el yazısı kullanıyor.

Neden bu iki kombinasyon? NN + AB veya MCTS + neden el yazılmıyor? MCTS AB'den daha iyiyse, Komodo MCTS neden Komodo AB'den daha güçlü değildir? AB MCTS'den daha iyiyse, Leela neden AB'yi kullanmıyor?


Sadece tahmin etmek gerekirse: NN örüntü tanıyanlardır. MCTS daha geniş bir ağ yayınladığından, NN'nin iyi ya da kötü olarak tanımak için eğitildiği kalıplarla karşılaşma olasılığı daha yüksektir.
John Coleman

Yanıtlar:


12

hız

Sinir ağları, el yapımı değerlendirme işlevlerinden çok daha yavaş çalışır. In TCEC Superfinal Leela Satranç Zero, özel tensör çekirdekli iki GPU'ları her çalışan, saniyede yaklaşık 60.000 pozisyonları arama yapabiliyor. Buna karşılık, bilgisayarımdaki tek bir çekirdek üzerinde bulunan Stockish, saniyede 2 milyondan fazla pozisyon arar.

Modern motorlar gereksiz dalları kesmek için çok çeşitli tekniklere sahip olsa da , alfa-beta ağaç araması hala çok kaba bir kuvvet tekniğidir ve iyi hareketleri belirlemek için çok sayıda konumun aranmasını gerektirir.

Buna karşılık MCTS, çok daha seçicidir ve arama ağacını yalnızca en umut verici hamlelere doğru genişletir, bu da aranabilecek daha sınırlı sayıda düğümden en iyi şekilde yararlanmasını sağlar.

En kötü durum davranışı

Alfa-beta aramasına dayalı bir motor için değerlendirme işlevinin temel gereksinimlerinden biri, en kötü durum davranışına sahip olması gerektiğidir . Bunun nedeni, değerlendirmedeki herhangi bir büyük hatanın, nadir de olsa, köke kolayca yayılması ve korkunç derecede yanlış bir hareketin oynatılmasına neden olmasıdır.

Karmaşıklıklarının doğası gereği, sinir ağları aşırı sığmaya eğilimlidir ve sadece onları eğitmek için kullanılan veriler kadar iyi olabilir. Örneğin, TCEC Sezon 14 Süperfinal'in 80. maçında , hareket halinde 47 Lc0, Stockish'in ekstra kraliçesi tarafından görünüşte havasız +0.77 olarak değerlendirilirken, Stockish (ve diğer birçok motor) +8.31'in değerlendirmesini yaptı. Bunun için popüler bir açıklama, Lc0'ın eğitim setinde tahtada çok sayıda kraliçe olan önemli sayıda oyuna sahip olmamış olabileceğidir.

Sinir ağları, bu nedenle, en kötü durum davranışına sahiptir ve bu nedenle alfa beta araması ile kötü performans göstermesi muhtemeldir. Buna karşılık MCTS, bir konuma atanan yanlış bir puanın, aramadaki yakındaki konumlara atanan makul puanlarla ortalamasını alarak dengelenmesini sağlar.

sessizlik

Tüm güçlü alfa-beta motorları , el işi değerlendirme işlevlerinin yalnızca beklemedeki yakalama veya denetlemelerin olmadığı "sessiz" konumlarda iyi çalıştığını kabul ederek, yaprak düğümlerine uygulanan sınırlı bir alfa-beta arama biçimi olan sessizlik araması adı verilen bir teknik kullanır. .

Örneğin, bir kraliçe değişiminin ilk yarısından hemen sonra, el işi bir değerlendirme fonksiyonu, sadece kraliçelerini almış olan tarafın tamamen kaybolduğunu söyleyebilir, oysa sinirsel bir ağ, kraliçenin yakında yeniden yakalanacağını anlayabilir.

Bu, el işi değerlendirme işlevlerini sessizlik araması olmadığından MCTS için benzer şekilde uygun hale getirir, bu da el işi işlevlerin çok az zaman almasına neden olur (her ne kadar Komodo 12 MCTS kısa alfa-beta aramaları kullanarak yine de bu kısıtlamayı aşarsa, bu nedenle el işi değerlendirmesinin makul bir puan vermesine izin verin)


2

AB ve MCTS, kendi değerlerinde birbirlerinden daha iyi olmak zorunda değildir. Sadece farklı temellerle daha iyi çalışan farklı arama algoritmalarıdır. NN için MCTS, motorun daha iyi olan dalları keşfetmesine izin verdiği için iyi çalışır. Bu motora ne istediğine bakmak için daha fazla özgürlük verir.

Bu arada AB ile prensipte tüm şubelere bakılmalıdır. Bunun nedeni, yinelemeli derinleşmeyle bile, motorun her yinelemede her dalda şimdiye kadar görünmesidir. Dolayısıyla, bir dalın bir taraf için gerçekten kazanıp kazanmadığını bilmiyor, sınırlı bir derinlikte kaybetmiş gibi görünse bile.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.