David Silver深度强化学习课程-中文字幕 10
David Silver 博士是 AlphaGo 的最主要研发人员。众所周知,AlphaGo 是第一个战胜人类顶级围棋高手的计算机围棋程序。AlphaGo 底层核心技术包括深度学习(deep learning)、强化学习(reinforcement learning),和蒙特卡洛搜索树(Monte Carlo tree search)。
在这门强化学习的课程中,Silver 博士从简介、马尔科夫决策过程(Markov Decision Processes)、免模型预测(Model-free Prediction)、免模型控制(Model-free Control)、值函数近似(Value Function Approximation)、策略梯度算法(Policy Gradient)、集成学习和计划(Integrating Learning and Planning)、探索与利用(Exploration and Exploitation)、游戏等方面深入浅出地介绍强化学习。课程中也涉及最近的热点:深度强化学习。
本周我们继续为大家带来该系列课程的第三课。课程资源获取方式如下:
>>>>获取第三课视频
关注“AI100”微信公众号,回复“第三课”获取视频链接。
学习形式
我们将每周推出两节由 AI100 翻译制作的课程,大家先添加管理员微信:765491606,申请加入学习小组进行讨论学习。此外,我们还将在每周末设置“Ask Me Anything”答疑环节。
关于AI100
AI100致力于打造人工智能技术和产业社区。为人工智能开发者提供信息和技术交流的平台;为人工智能创业者提供行业数据及智能应用的商业场景;为行业提供人工智能化的技术商业应用。请快快关注AI100公众号吧!