«q-learning» etiketlenmiş sorular

2
“Tecrübe tekrarı” nedir ve faydaları nelerdir?
Google'ın DeepMind Atari belgesini okuyorum ve "deneyim tekrarı" kavramını anlamaya çalışıyorum. Tecrübe tekrarı diğer pek çok takviye öğrenme makalesinde (özellikle AlphaGo kağıdı) ortaya çıkıyor, bu yüzden nasıl çalıştığını anlamak istiyorum. Aşağıda bazı alıntılar bulunmaktadır. İlk olarak, veriler üzerinde rasgele dağıtılan, böylece gözlem dizisindeki korelasyonları kaldıran ve veri dağılımındaki değişiklikler üzerinde …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.