Yapay zeka combinatorial-games

4

Takviye öğreniminde geçersiz hareketler nasıl ele alınır?

Arka arkaya beş / gomoku oynayabilen bir yapay zeka yaratmak istiyorum. Başlıkta bahsettiğim gibi, bunun için pekiştirici öğrenmeyi kullanmak istiyorum. Kullandığım ilke gradyan başlangıç ile, yani takviye yöntemi. Değer ve politika işlevi yaklaşımı için bir sinir ağı kullanıyorum . Evrişimli ve tamamen bağlı katmanlara sahiptir. Çıktı hariç tüm katmanlar paylaşılır. …

20 machine-learning reinforcement-learning game-ai combinatorial-games

1

Sinir ağları vs Tic Tac Toe gibi oyunlarda genetik algoritmalar?

Şu anda Gomoku oyunu oynamak için bir AI oluşturmakla ilgili bir proje yapıyorum (tic tac toe gibi, ancak 15 * 15 tahtada oynandı ve kazanmak için üst üste 5 tane gerekiyor). Zaten Q öğrenimini kullanarak ve oyun durumlarını / eylemlerini bir tabloda depolayarak mükemmel bir tic tac toe AI uyguladım, …

9 neural-networks machine-learning genetic-algorithms combinatorial-games

1

Takviye öğreniminin satranç gibi oyunlara uygulanmasıyla ilgili birkaç şüphe

Satranç benzeri bir masa oyunu icat ettim. Otonom olarak oynayabilmek için bir motor yaptım. Motor temel olarak bir karar ağacıdır. Oluşturan: Her düğümde olası tüm yasal hareketleri bulan bir arama işlevi Tahta pozisyonuna sayısal bir değer atayan bir değerlendirme fonksiyonu (olumlu, ilk oyuncuların üstünlüğü elde ettiği anlamına gelir, negatif, ikinci …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

«combinatorial-games» etiketlenmiş sorular