太阳集团2138备用网址

  • 2019-06-26
  • [加油!向未来]国产大飞机C919遇严峻考验 机翼被“虐”向上弯曲3米 2019-06-26
  • “新四大发明”火了!中国与世界有了新的沟通桥梁 2019-06-26
  • 《都挺好》曝光终极预告 直击当代家庭“痛点” 2019-06-26
  • 2019-06-26
  • 2019-06-26
  • 7月可乘直升机游览青海湖 2019-06-26
  • 2019-06-26
  • 培华学院召开新闻信息培训暨表彰大会 2019-06-26
  • 吉林师范大学《见地》摄影比赛作品选登 2019-06-26
  • 广州南沙工商企业获得电力暖心服务 2019-06-26
  • 张兴海:汽车新制造是全生命周期的新的制造理念和体系 2019-06-21
  • 2019年03月08日 星期五 2019-06-21
  • 【红人馆】合肥摆了9年的米糕摊又小又难找 摊主竟是两位聋哑合伙人! 2019-06-21
  • 华为 Mate 7(尊爵版电信4G)评论 2019-06-21
  • 欢迎来到 黑吧太阳集团2138备用网址是业内专业的游戏平台,为你提供各式各样的精品游戏,最全的游戏项目,同时还为您提供各种游戏专题游戏攻略人气论坛。

    深入浅出强化学习:原理入门 中文pdf完整版[112MB] 含源代码

    太阳集团2138备用网址 www.r-island.com

    • 软件大小:0 Bytes
    • 软件语言:简体中文
    • 软件类型:电子书
    • 软件授权:免费软件
    • 更新时间:2019-02-25
    • 标签:
    • 开 发 商:Home Page
    • 应用平台:XP/Win7/Win8/Win10
    软件评分
    网友评分:5

    深入浅出强化学习:原理入门 中文pdf完整版[112MB] 含源代码软件介绍

    《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。

    基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。

    除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。

    目录
    1 绪论 1
    第一篇 强化学习基础 17
    2 马尔科夫决策过程 18
    3 基于模型的动态规划方法 36
    第二篇 基于值函数的强化学习方法 57
    4 基于蒙特卡罗的强化学习方法 58
    5 基于时间差分的强化学习方法 75
    6 基于值函数逼近的强化学习方法 88
    第三篇 基于直接策略搜索的强化学习方法 125
    7 基于策略梯度的强化学习方法 126
    8 基于置信域策略优化的强化学习方法 142
    9 基于确定性策略搜索的强化学习方法 165
    10 基于引导策略搜索的强化学习方法 171
    第四篇 强化学习研究及前沿 185
    11 逆向强化学习 186
    12 组合策略梯度和值函数方法 202
    13 值迭代网络 207
    14 基于模型的强化学习方法:PILCO及其扩展 214
    • 热门下载