3
Eğer çevre de stokastikse optimal politika her zaman stokastik midir?
Eğer çevre de stokastik ise, optimal politika her zaman stokastik midir (yani, eyaletlerden eylemler üzerinde olasılık dağılımına bir harita)? Sezgisel olarak, eğer ortam belirleyici ise (yani, etmen bir durumda ise)sss ve harekete geçiyor aaa, sonra bir sonraki eyalet s′s′s' hangi zaman adımı olursa olsun her zaman aynıdır), o zaman optimal …