«combinatorial-games» etiketlenmiş sorular

4
Takviye öğreniminde geçersiz hareketler nasıl ele alınır?
Arka arkaya beş / gomoku oynayabilen bir yapay zeka yaratmak istiyorum. Başlıkta bahsettiğim gibi, bunun için pekiştirici öğrenmeyi kullanmak istiyorum. Kullandığım ilke gradyan başlangıç ile, yani takviye yöntemi. Değer ve politika işlevi yaklaşımı için bir sinir ağı kullanıyorum . Evrişimli ve tamamen bağlı katmanlara sahiptir. Çıktı hariç tüm katmanlar paylaşılır. ...


1
Takviye öğreniminin satranç gibi oyunlara uygulanmasıyla ilgili birkaç şüphe
Satranç benzeri bir masa oyunu icat ettim. Otonom olarak oynayabilmek için bir motor yaptım. Motor temel olarak bir karar ağacıdır. Oluşturan: Her düğümde olası tüm yasal hareketleri bulan bir arama işlevi Tahta pozisyonuna sayısal bir değer atayan bir değerlendirme fonksiyonu (olumlu, ilk oyuncuların üstünlüğü elde ettiği anlamına gelir, negatif, ikinci ...
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.