«game-ai» etiketlenmiş sorular

4
Takviye öğreniminde geçersiz hareketler nasıl ele alınır?
Arka arkaya beş / gomoku oynayabilen bir yapay zeka yaratmak istiyorum. Başlıkta bahsettiğim gibi, bunun için pekiştirici öğrenmeyi kullanmak istiyorum. Kullandığım ilke gradyan başlangıç ile, yani takviye yöntemi. Değer ve politika işlevi yaklaşımı için bir sinir ağı kullanıyorum . Evrişimli ve tamamen bağlı katmanlara sahiptir. Çıktı hariç tüm katmanlar paylaşılır. …


2
Izgara tabanlı bir oyunu öğrenmek için sinir ağı için giriş / çıkış kodlaması
Bunun üzerine derin bir sinir ağını eğitmek amacıyla basit bir oyuncak oyunu yazıyorum. Oyun kuralları kabaca şu şekildedir: Oyunda altıgen hücrelerden oluşan bir tahta var. Her iki oyuncu da tahtada serbestçe konumlandırmayı seçebilecekleri aynı parça koleksiyonuna sahiptir. Konumlarına ve konfigürasyonlarına bağlı olarak farklı parçaların yerleştirilmesi puan verir (veya rakibin puanlarını …

2
AlphaZero bir AGI örneği mi?
DeepMind'in arxiv.org'daki araştırma belgesinden: Bu yazıda, AlphaZero olarak adlandırdığımız benzer ama tamamen genel bir algoritmayı satranç ve shogi oyunlarına ve Go'ya , oyunun kuralları dışında herhangi bir ek alan bilgisi olmadan, genel amaçlı bir takviye öğreniminin gösterdiğini gösteriyoruz. algoritma elde edebilirsiniz, tabula rasa, birçok zorlu alanda insanüstü performans. Bu AlphaZero'nun …

3
Yuvarlak tabanlı bir masa oyunu için sinir ağı nasıl eğitilir?
Tic-tac-toe, satranç, risk veya başka bir yuvarlak tabanlı oyun gibi yuvarlak tabanlı bir masa oyunu için sinir ağı nasıl eğitileceğini merak ediyorum. Bir sonraki hamlenin çıkarım yoluyla elde edilmesi, oyun durumunu girdi olarak besleyerek ve çıktıyı mevcut oyuncu için hamle olarak kullanarak oldukça basit görünüyor. Bununla birlikte, bu amaç için …


1
Takviye öğreniminin satranç gibi oyunlara uygulanmasıyla ilgili birkaç şüphe
Satranç benzeri bir masa oyunu icat ettim. Otonom olarak oynayabilmek için bir motor yaptım. Motor temel olarak bir karar ağacıdır. Oluşturan: Her düğümde olası tüm yasal hareketleri bulan bir arama işlevi Tahta pozisyonuna sayısal bir değer atayan bir değerlendirme fonksiyonu (olumlu, ilk oyuncuların üstünlüğü elde ettiği anlamına gelir, negatif, ikinci …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.