![]()
编辑推荐 本书源于斯坦福大学的课程“不确定性状态下的决策”,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书主要关注规划和强化学习,其中一些技术涉及监督学习和优化。书中的算法是用Julia编程语言实现的,并配有大量图表、示例和练习题。 内容推荐 本书主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法,共分为五个部分。首先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括准确信念状态规划、离线信念状态规划、在线信念状态规划等;最后讨论多智能体系统,涉及多智能体推理和协作智能体等。 目录 \t译者序 前言 致谢 第1章导论 1.1决策 1.2应用 1.2.1飞机防撞控制系统 1.2.2自动驾驶控制系统 1.2.3乳腺癌筛查 1.2.4金融消费与投资组合配置 1.2.5分布式森林火灾监控系统 1.2.6火星科学探测 1.3方法 1.3.1显式编程 1.3.2监督式学习 1.3.3优化 1.3.4规划 1.3.5强化学习 1.4自动化决策过程的历史 1.4.1经济学 ……
|