在强化学习(二)马尔科夫决策过程中,我们讨论了用马尔科夫假设来简化强化学习模型的复杂度,这一篇我们在马尔科夫假设和贝尔曼方程的基础上讨论使用动态规划来求解强化学习的问题。第二是可以找到子问题状态之间的递推关系,通过较小的子问题状态递推出较大的子问题的状态。
安科网(Ancii),中国第一极客网
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号