Tic-tac-toe, satranç, risk veya başka bir yuvarlak tabanlı oyun gibi yuvarlak tabanlı bir masa oyunu için sinir ağı nasıl eğitileceğini merak ediyorum. Bir sonraki hamlenin çıkarım yoluyla elde edilmesi, oyun durumunu girdi olarak besleyerek ve çıktıyı mevcut oyuncu için hamle olarak kullanarak oldukça basit görünüyor. Bununla birlikte, bu amaç için bir yapay zeka eğitimi o kadar basit görünmüyor, çünkü:
- Tek bir hamlenin iyi olup olmadığı bir derecelendirme olmayabilir, bu nedenle tek hamlelerin eğitimi doğru seçim gibi görünmüyor
- Sinir ağını eğitmek için tüm oyunun tüm durumlarını (girişlerini) ve hareketlerini (çıkışlarını) kullanmak doğru bir seçim değildir, çünkü kayıp bir oyundaki tüm hareketler kötü olmayabilir
Yani yuvarlak tabanlı bir masa oyunu için bir sinir ağını nasıl eğiteceğimizi merak ediyorum? Tensorflow kullanarak tic-tac-toe için sinir ağı oluşturmak istiyorum.