Programlama reinforcement-learning

7

Görsel giriş kullanarak Diablo 2 oynamak için yapay bir sinir ağı nasıl eğitilir?

Şu anda bir video oyunu oynamak için YSA almaya çalışıyorum ve buradaki harika topluluktan biraz yardım almayı umuyordum. Diablo 2'ye yerleştim. Oyun böylece gerçek zamanlı ve izometrik bir bakış açısından, oyuncu kameranın ortalandığı tek bir avatarı kontrol ediyor. İşleri somut hale getirmek için görev, canını öldürmeden canavar x deneyim puanlarınızı …

139 machine-learning computer-vision neural-network video-processing reinforcement-learning

4

Değer yinelemesi ile ilke yinelemesi arasındaki fark nedir?

Pekiştirmeli öğrenmede, politika yinelemesi ile değer yinelemesi arasındaki fark nedir? Anladığım kadarıyla, değer yinelemesinde, en uygun politikayı çözmek için Bellman denklemini kullanıyorsunuz, oysa politika yinelemesinde rastgele bir politika seçiyorsunuz ve bu politikanın ödülünü buluyorsunuz. Şüphem şu ki, PI'da rastgele bir politika seçiyorsanız, birkaç rastgele politika seçiyor olsak bile, en uygun …

94 machine-learning reinforcement-learning markov-models value-iteration

1

Degrade İlkesi Türetmeyi Anlama

Kökeni kaynak Andrej Karpathy blogundan , Politika Gradyanının çok basit bir örneğini yeniden oluşturmaya çalışıyorum . Bu makalede, ağırlık listesi ve Softmax aktivasyonu içeren CartPole ve Politika Gradyanı ile örnek bulacaksınız. İşte mükemmel çalışan CartPole politika gradyanının yeniden oluşturulmuş ve çok basit bir örneği . import gym import numpy as …

19 python machine-learning math deep-learning reinforcement-learning

1

TypeError: len sembolik Tensörler için iyi tanımlanmamıştır. (activation_3 / Kimlik: 0) Şekil bilgileri için lütfen "len (x)" yerine "x.shape" çağrısını yapın

OpenAI spor salonunun bir oyununa bir DQL modeli uygulamaya çalışıyorum. Ama bana aşağıdaki hatayı veriyor. TypeError: len sembolik Tensörler için iyi tanımlanmamıştır. (activation_3 / Kimlik: 0) Şekil bilgileri x.shapeyerine lütfen arayın len(x). Spor salonu ortamı oluşturma: ENV_NAME = 'CartPole-v0' env = gym.make(ENV_NAME) np.random.seed(123) env.seed(123) nb_actions = env.action_space.n Modelim şöyle görünüyor: …

10 python tensorflow keras reinforcement-learning keras-rl

«reinforcement-learning» etiketlenmiş sorular