您现在的位置是: 首页 >  人工智能 书本信息

强化学习精要:核心算法与TensorFlow实现 (冯超著) pdf高清版[87MB]

qianhu2021-05-05 【机器学习】

简介强化学习精要:核心算法与TensorFlow实现 (冯超著) pdf高清版[87MB],本书是人工智能深度学习机器学习领域力作,深入浅出介绍强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,剖析强化学习基本概念、马尔可夫决策过程、值函数、MCTS 反向强化学习等算法

查看电子书下载链接

《强化学习精要:核心算法与TensorFlow 实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程,到各种复杂的强化学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了算法之间的内在联系,可以帮助读者举一反三,掌握算法精髓。书中介绍的代码可以帮助读者快速将算法应用到实践中。

《强化学习精要:核心算法与TensorFlow 实现》内容翔实,语言简洁易懂,既适合零基础的人员入门学习,也适合相关科研人员研究参考。

目录

第一部分强化学习入门与基础知识
1 引言2
2 数学与机器学习基础17
3 优化算法47
4 TensorFlow 入门78
5 Gym 与Baselines 130
6 强化学习基本算法145
第二部分最优价值算法
7 Q-Learning 基础173
8 DQN 的改进算法203
第三部分基于策略梯度的算法
9 基于策略梯度的算法229
10 使策略单调提升的优化算法244
11 Off-Policy 策略梯度法265
第四部分其他强化学习算法
12 稀疏回报的求解方法291
13 Model-based 方法305
第五部分反向强化学习
14 反向强化学习入门330
15 反向强化学习算法2.0 345

.

点击下载电子书

相关文章

  • 嵌入式C语言面试题汇总(超经典) 中文pdf版

    嵌入式C语言面试题汇总(超经典) 中文pdf版,这里归纳了嵌入式软件开发工程师、C/C++工程师在面试过程中常考问题,对各大论坛出现的面试题进行了一定的整理汇总,欢迎下载

  • Swarm容器编排与Docker原生集群 带目录完整版pdf[69MB]

    Swarm容器编排与Docker原生集群 带目录完整版pdf[69MB] ,本书涵盖了Swarm中的发现、调度、高可用、安全和平台伸缩性等重要主题,能帮助你了解Swarm如何组建包含4700个节点的集群,并掌握Swarm的使用与管理,以及如何使用实现大规模应用的可伸缩

  • ASP.NET3.5 高级程序设计

    ASP.NET3.5 高级程序设计 ,图书格式:PDF 《ASP.NET 3.5高级程序设计》(Pro ASP.NET 3.5 in C# 2008 second edtion)第2版[PDF] 本书是ASP.NET 领域的鸿篇巨制,全面讲解了ASP.NET 3.5 的各种特性及其背后的工作原理,并给出了许多针对如何构建复杂、可扩展的网站从实践中得出的建议。本书还深入讲述

  • 引爆社群:移动互联网时代的新4C法则 完整pdf扫描版[16MB]

    引爆社群:移动互联网时代的新4C法则 完整pdf扫描版[16MB] ,科技延伸媒介,移动互联网技术催生了微信等各种新的媒体;媒介更新人文,新媒介让互联网重回社群时代;本书提出的“新4C法则”为此给出了解决方案。感兴趣的可以了解一下

  • C#图解教程第一部分 中文pdf版

    C#图解教程第一部分 中文pdf版,《C#图解教程》是一本广受赞誉的C#教程。它以图文并茂的形式,用朴实简洁的文字,并辅之以大量表格和代码示例,精炼而全面地阐述了最新版C# 语言的各种特性,使读者能够快速理解、学习和使用C#

  • Premiere Pro CC实例教程(全彩版) [古城 刘焰 著] 中文PDF版 28MB

    Premiere Pro CC实例教程(全彩版) [古城 刘焰 著] 中文PDF版 28MB,本书上篇“剪辑操作”从介绍剪辑与Premiere Pro基础操作开始,学习素材的导入、多种剪辑方法的使用、视音频及图文编辑、输出和备份管理等内容;下篇“效果应用”学习了视音频的过渡、效果、外挂插件及结合其他软件的制作