«reinforcement-learning» etiketlenmiş sorular

7
Görsel giriş kullanarak Diablo 2 oynamak için yapay bir sinir ağı nasıl eğitilir?
Şu anda bir video oyunu oynamak için YSA almaya çalışıyorum ve buradaki harika topluluktan biraz yardım almayı umuyordum. Diablo 2'ye yerleştim. Oyun böylece gerçek zamanlı ve izometrik bir bakış açısından, oyuncu kameranın ortalandığı tek bir avatarı kontrol ediyor. İşleri somut hale getirmek için görev, canını öldürmeden canavar x deneyim puanlarınızı …

4
Değer yinelemesi ile ilke yinelemesi arasındaki fark nedir?
Pekiştirmeli öğrenmede, politika yinelemesi ile değer yinelemesi arasındaki fark nedir? Anladığım kadarıyla, değer yinelemesinde, en uygun politikayı çözmek için Bellman denklemini kullanıyorsunuz, oysa politika yinelemesinde rastgele bir politika seçiyorsunuz ve bu politikanın ödülünü buluyorsunuz. Şüphem şu ki, PI'da rastgele bir politika seçiyorsanız, birkaç rastgele politika seçiyor olsak bile, en uygun …

1
Degrade İlkesi Türetmeyi Anlama
Kökeni kaynak Andrej Karpathy blogundan , Politika Gradyanının çok basit bir örneğini yeniden oluşturmaya çalışıyorum . Bu makalede, ağırlık listesi ve Softmax aktivasyonu içeren CartPole ve Politika Gradyanı ile örnek bulacaksınız. İşte mükemmel çalışan CartPole politika gradyanının yeniden oluşturulmuş ve çok basit bir örneği . import gym import numpy as …

1
TypeError: len sembolik Tensörler için iyi tanımlanmamıştır. (activation_3 / Kimlik: 0) Şekil bilgileri için lütfen "len (x)" yerine "x.shape" çağrısını yapın
OpenAI spor salonunun bir oyununa bir DQL modeli uygulamaya çalışıyorum. Ama bana aşağıdaki hatayı veriyor. TypeError: len sembolik Tensörler için iyi tanımlanmamıştır. (activation_3 / Kimlik: 0) Şekil bilgileri x.shapeyerine lütfen arayın len(x). Spor salonu ortamı oluşturma: ENV_NAME = 'CartPole-v0' env = gym.make(ENV_NAME) np.random.seed(123) env.seed(123) nb_actions = env.action_space.n Modelim şöyle görünüyor: …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.