网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 深度强化学习(基础研究与应用)
分类
作者 董豪//丁子涵//仉尚航
出版社 电子工业出版社
下载
简介
内容推荐
深度强化学习结合深度学习与强化学习算法各自的优势解决复杂的决策任务。得益于Deep Mind AlphaGo和Open AI Five成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。本书分为三大部分,覆盖深度强化学习的全部内容。第一部分介绍深度学习和强化学习的入门知识、一些非常基础的深度强化学习算法及其实现细节,包括第1~6章。第二部分是一些精选的深度强化学习研究题目,这些内容对准备开展深度强化学习研究的读者非常有用,包括第7~12章。第三部分提供了丰富的应用案例,包括Alpha Zero、让机器人学习跑步等,包括第13~17章。本书是为计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生准备的。本书也适合没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师阅读。
目录
基础部分
第1章 深度学习入门
1.1 简介
1.2 感知器
1.3 多层感知器
1.4 激活函数
1.5 损失函数
1.6 优化
1.6.1 梯度下降和误差的反向传播
1.6.2 随机梯度下降和自适应学习率
1.6.3 超参数筛选
1.7 正则化
1.7.1 过拟合
1.7.2 权重衰减
1.7.3 Dropout
1.7.4 批标准化
1.7.5 其他缓和过拟合的方法
1.8 卷积神经网络
1.9 循环神经网络
1.10 深度学习的实现样例
1.10.1 张量和梯度
1.10.2 定义模型
1.10.3 自定义层
1.10.4 多层感知器:MNIST数据集上的图像分类
1.10.5 卷积神经网络:CIFAR-10数据集上的图像分类
1.10.6 序列到序列模型:聊天机器人
第2章 强化学习入门
2.1 简介
2.2 在线预测和在线学习
2.2.1 简介
2.2.2 随机多臂赌博机
2.2.3 对抗多臂赌博机
2.2.4 上下文赌博机
2.3 马尔可夫过程
2.3.1 简介
2.3.2 马尔可夫奖励过程
2.3.3 马尔可夫决策过程
2.3.4 贝尔曼方程和最优性
2.3.5 其他重要概念
2.4 动态规划
2.4.1 策略迭代
2.4.2 价值迭代
2.4.3 其他DPs:异步DP、近似DP和实时DP
2.5 蒙特卡罗
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/22 13:02:04