网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python强化学习实战(应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习)/机器学习系列
分类
作者 (印度)苏达桑·拉维尚迪兰
出版社 机械工业出版社
下载
简介
内容推荐
强化学习(RL)是人互智能体的前沿和非常具有发展前途的分支。苏达桑·拉维尚迪兰著的《Python强化学习实战(应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习)》不仅可帮助读者掌握基本的强化学习算法,还有助于掌握先进的深度强化学习算法。
本书首先介绍了强化学习以及OpenAl Gym和TensorFlow,然后探讨了各种强化学习算法和概念,如马尔可夫决策过程、蒙特卡罗方法和动态规划,其中包括值迭代和策略迭代。根据本书中示例丰富的指南,详细介绍了深度强化学习算法,如对抗DQN、DRQN、A3C、PPO和TRPO等。同时,还将学习I2A、DQfd、HER以及更多的强化学习最新进展。
在本书结尾处,将回顾在项目中实现强化学习和深度强化学习所需的所有知识和经验,并且将真正进入人工智能的世界。
作者简介
苏达桑·拉维尚迪兰(Sudharsan Ravichandiran),是一位数据科学家、研究员、人工智能爱好者以及YouTuber,获得了Anna大学信息技术学生学位。他的研究领域包括深度学习和强化学习的实现,其中包括自然语言处理和计算机视觉。他曾是一名自由职业的网页开发人员和设计师,所设计开发的网站屡获殊荣,同时也热衷于开源,擅长解答堆栈溢出问题。
目录
译者序
原书前言
第1章 强化学习简介
1.1 什么是强化学习
1.2 强化学习算法
1.3 强化学习与其他机器学习范式的不同
1.4 强化学习的要素
1.4.1 智能体
1.4.2 策略函数
1.4.3 值函数
1.4.4 模型
1.5 智能体环境接口
1.6 强化学习的环境类型
1.6.1 确定性环境
1.6.2 随机性环境
1.6.3 完全可观测环境
1.6.4 部分可观测环境
1.6.5 离散环境
1.6.6 连续环境
1.6.7 情景和非情景环境
1.6.8 单智能体和多智能体环境
1.7 强化学习平台
1.7.1 OpenAI Gym和Universe
1.7.2 DeepMind Lab
1.7.3 RL-Glue
1.7.4 Project Malmo
1.7.5 VizDoom
1.8 强化学习的应用
1.8.1 教育
1.8.2 医疗和健康
1.8.3 制造业
1.8.4 库存管理
1.8.5 金融
1.8.6 自然语言处理和计算机视觉
1.9 小结
1.10 问题
1.11 扩展阅读
第2章 从OpenAI和TensorFlow入门
2.1 计算机设置
2.1.1 安装Anaconda
2.1.2 安装Docker
2.1.3 安装OpenAI Gym和Universe
2.2 OpenAI Gym
2.2.1 基本模拟
2.2.2 训练机器人行走
2.3 OpenAI Universe
2.3.1 构建一个视频游戏机器人
2.4 TensorFlow
2.4.1 变量、常量和占位符
2.4.2 计算图
2.4.3 会话
2.4.4 TensorBoard
2.5 小结
2.6 问题
2.7 扩展阅读
第3章 马尔可夫决策过程和动态规划
第4章 基于蒙特卡罗方法的博弈游戏
第5章 时间差分学习
第6章 MAB问题
第7章 深度学习基础
第8章 基于DQN的Atari游戏
第9章 基于DRQN玩Doom游戏
第10章 A3C网络
第11章 策略梯度和优化
第12章 Capstone项目—基于DQN的赛车游戏
第13章 最新进展和未来发展
附录 知识点
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/22 23:38:50