以PyTorch为工具,在Python中实践深度强化学习。
Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的GPU能力,提供最大的灵活性和速度。
本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、DuelingNetwork、PrioritizedExperienceReplay、A3C、A2C)。
第1章 强化学习概述
1.1 机器学习的分类(监督学习、非监督学习、强化学习)
1.1.1 术语整理
1.1.2 监督学习、非监督学习、强化学习
1.2 强化学习、深度强化学习的历史
1.2.1 强化学习和大脑学习
1.2.2 强化学习和深度学习的结合
1.3 深度强化学习的应用实例
1.3.1 深度强化学习的应用实例
1.3.2 深度强化学习的未来前景
第2章 在走迷宫任务中实现强化学习
2.1 Try Jupyter的使用方法
2.1.1 强化学习的实现和执行环境
2.1.2 Try Jupyter的介绍
2.2 迷宫和智能体的实现
2.2.1 迷宫的实现
2.2.2 智能体的实现
2.3 策略迭代法的实现
2.3.1 策略迭代法与价值迭代法
2.3.2 根据策略梯度法移动智能体
2.3.3 根据策略梯度法更新策略
2.3.4 策略梯度法的相关理论
2.4 价值迭代法的术语整理
2.4.1 奖励
2.4.2 动作价值和状态价值
2.4.3 贝尔曼方程和马尔可夫决策过程
2.5 Sarsa的实现
2.5.1 用ε-贪婪法实现策略
2.5.2 使用Sarsa算法更新动作价值函数Q(s,a)
2.5.3 用Sarsa解决迷宫问题的实现
2.6 实现Q学习
2.6.1 Q学习算法
2.6.2 Q学习的实现
第3章 在倒立摆任务中实现强化学习
3.1 在本地PC上准备强化学习的实现和执行环境
3.1.1 安装Anaconda并配置Python执行环境
3.1.2 安装强化学习所需的库
3.2 倒立摆任务“CartPole”
3.2.1 关于CartPole
3.2.2 CartPole的实现
3.3 由多变量连续值表示的状态的表格表示
3.3.1 CartPole的状态
3.3.2 状态离散化的实现
3.4 Q学习的实现
第4章 使用PyTorch实现深度学习
4.1 神经网络和深度学习的历史
4.1.1 第一次神经网络热潮
4.1.2 第二次神经网络热潮
4.1.3 第三次神经网络热潮
4.2 深度学习的计算方法
4.2.1 推理阶段
4.2.2 学习阶段
4.3 使用PyTorch实现MNIST手写数字分类任务
4.3.1 关于PyTorch
4.3.2 准备PyTorch的执行环境
4.3.3 获取MNIST数据
4.3.4 使用PyTorch实现深度学习
4.3.5 关于如何使用PyTorch的补充
第5章 深度强化学习DQN的实现
5.1 深度强化学习DQN(深度Q网络)的说明
5.1.1 表格表示问题
5.1.2 深度强化学习DQN的说明
5.2 实现DQN的四个要点
5.3 实现DQN(上)
5.3.1 使用PyTorch实现DQN时需要注意的事项
5.3.2 DQN的实现
5.4 实现DQN(下)
第6章 实现深度强化学习的改进版
6.1 深度强化学习算法发展图
6.2 DDQN的实现
6.2.1 DDQN概述
6.2.2 DDQN的实现
6.3 Dueling Network的实现
6.3.1 Dueling Network概述
6.3.2 Dueling Network的实现
6.4 优先经验回放的实现
6.4.1 优先经验回放概述
6.4.2 实现优先经验回放
6.5 A2C的实现
6.5.1 A2C概述
6.5.2 A2C的实现
第7章 在AWS GPU环境中实现消砖块游戏
7.1 消砖块游戏“Breakout”的描述
7.2 准备在AWS上使用GPU所需要的深度学习执行环境
7.2.1 创建AWS账户
7.2.2 Ubuntu终端的安装
7.2.3 创建用于与虚拟服务器通信的密钥
7.2.4 在AWS上构建用于执行深度学习的虚拟服务器
7.2.5 准备Breakout的执行环境
7.3 学习Breakout的四个关键思想
7.3.1 设置本地PC的环境
7.3.2 学习Breakout的关键思想
7.4 A2C的实现(上)
7.5 A2C的实现(下)
评分及书评
目前还没人评分
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。