2
“Tecrübe tekrarı” nedir ve faydaları nelerdir?
Google'ın DeepMind Atari belgesini okuyorum ve "deneyim tekrarı" kavramını anlamaya çalışıyorum. Tecrübe tekrarı diğer pek çok takviye öğrenme makalesinde (özellikle AlphaGo kağıdı) ortaya çıkıyor, bu yüzden nasıl çalıştığını anlamak istiyorum. Aşağıda bazı alıntılar bulunmaktadır. İlk olarak, veriler üzerinde rasgele dağıtılan, böylece gözlem dizisindeki korelasyonları kaldıran ve veri dağılımındaki değişiklikler üzerinde …