阿尔法零对最优模型预测自适应控制的启示/信息技术和电气工程学科国际知名教材中译本系列(美)德梅萃·P.博塞克斯清华大学出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

书名

阿尔法零对最优模型预测自适应控制的启示/信息技术和电气工程学科国际知名教材中译本系列

分类

作者

(美)德梅萃·P.博塞克斯

出版社

清华大学出版社

下载

简介

内容推荐

德梅萃·P.博塞克斯（Dimitri P.Bertsekas）教授是国际运筹优化与控制领域的著名学者，其系列经典教材被清华大学、麻省理工学院等国内外高校广泛使用。本书构建了近似动态规划和强化学习的新的理论框架，简洁但雄心勃勃。这一框架以离线训练和在线学习这两类算法为中心，彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩，在看似纷繁复杂的数据与算法表象之下，其实蕴藏着简洁而美妙的规律。通过本书的学习，读者将能体会经典优化控制理论在分析和理解当代强化学习算法性能中的强大威力，更能领悟到以阿尔法零为代表的新一代算法浪潮为经典理论提供的新的发展机遇。本书适合作为普通高等学校信息科学技术领域研究生、本科生高年级教材，也可供本领域科研人员自学参考。

作者简介

贾庆山，男，博士，清华大学自动化系副教授。分别于2002年、2006年获得清华大学自动化系学士、博士学位，并留校任教。分别于2006年赴哈佛大学、2010年赴香港科技大学、2013年赴麻省理工学院任访问学者。主要研究方向为离散事件动态系统的仿真与性能优化，及在智能建筑与智能电网中的应用。

第1章阿尔法零、离线训练和在线学习
1.1 离线训练和策略迭代
1.2 在线学习与值空间近似——截断滚动
1.3 阿尔法零的经验
1.4 强化学习的一种新概念框架
1.5 注释与参考文献
第2章确定性和随机的动态规划
2.1 无限时段上的最优控制
2.2 值空间近似
2.3 注释与参考文献
第3章强化学习的抽象视角
3.1 贝尔曼算子
3.2 值空间近似和牛顿法
3.3 稳定域
3.4 策略迭代、滚动和牛顿法
3.5 在线对弈对于离线训练过程有多敏感？
3.6 何不直接训练策略网络并在使用时摒弃在线对弈呢？
3.7 多智能体问题和多智能体滚动
3.8 在线简化策略迭代
3.9 例外情形
3.10 注释与参考文献
第4章线性二次型情形——例证
4.1 最优解
4.2 稳定线性策略的费用函数
4.3 值迭代
4.4 单步和多步前瞻——牛顿步的解释
4.5 灵敏度问题
4.6 滚动和策略迭代
4.7 截断滚动——前瞻长度问题
4.8 线性二次型问题中的例外行为
4.9 注释与参考文献
第5章自适应和模型预测控制
5.1 具有未知参数的系统——鲁棒和PID控制
5.2 值空间近似、滚动和自适应控制
5.3 值空间近似、滚动和模型预测控制
5.4 末端费用近似——稳定性问题
5.5 注释与参考文献
第6章有限时段确定性问题——离散优化
6.1 确定性离散空间有限时段问题
6.2 一般离散优化问题
6.3 值空间近似
6.4 离散优化的滚动算法
6.5 采用多步前瞻的滚动——截断滚动
6.6 约束形式的滚动算法
6.7 使用部分可观马尔可夫决策问题模型滚动的自适应控制
6.8 极小化极大控制的滚动
6.9 小阶段费用与长时段——连续时间滚动
6.10 结语
附录A 不动点问题的牛顿法
A.1 可微不动点问题的牛顿法
A.2 无须贝尔曼算子可微性的牛顿法
参考文献

随便看

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

书名	阿尔法零对最优模型预测自适应控制的启示/信息技术和电气工程学科国际知名教材中译本系列
分类
作者	(美)德梅萃·P.博塞克斯
出版社	清华大学出版社
下载
简介	内容推荐德梅萃·P.博塞克斯（Dimitri P.Bertsekas）教授是国际运筹优化与控制领域的著名学者，其系列经典教材被清华大学、麻省理工学院等国内外高校广泛使用。本书构建了近似动态规划和强化学习的新的理论框架，简洁但雄心勃勃。这一框架以离线训练和在线学习这两类算法为中心，彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩，在看似纷繁复杂的数据与算法表象之下，其实蕴藏着简洁而美妙的规律。通过本书的学习，读者将能体会经典优化控制理论在分析和理解当代强化学习算法性能中的强大威力，更能领悟到以阿尔法零为代表的新一代算法浪潮为经典理论提供的新的发展机遇。本书适合作为普通高等学校信息科学技术领域研究生、本科生高年级教材，也可供本领域科研人员自学参考。作者简介贾庆山，男，博士，清华大学自动化系副教授。分别于2002年、2006年获得清华大学自动化系学士、博士学位，并留校任教。分别于2006年赴哈佛大学、2010年赴香港科技大学、2013年赴麻省理工学院任访问学者。主要研究方向为离散事件动态系统的仿真与性能优化，及在智能建筑与智能电网中的应用。目录第1章阿尔法零、离线训练和在线学习 1.1 离线训练和策略迭代 1.2 在线学习与值空间近似——截断滚动 1.3 阿尔法零的经验 1.4 强化学习的一种新概念框架 1.5 注释与参考文献第2章确定性和随机的动态规划 2.1 无限时段上的最优控制 2.2 值空间近似 2.3 注释与参考文献第3章强化学习的抽象视角 3.1 贝尔曼算子 3.2 值空间近似和牛顿法 3.3 稳定域 3.4 策略迭代、滚动和牛顿法 3.5 在线对弈对于离线训练过程有多敏感？ 3.6 何不直接训练策略网络并在使用时摒弃在线对弈呢？ 3.7 多智能体问题和多智能体滚动 3.8 在线简化策略迭代 3.9 例外情形 3.10 注释与参考文献第4章线性二次型情形——例证 4.1 最优解 4.2 稳定线性策略的费用函数 4.3 值迭代 4.4 单步和多步前瞻——牛顿步的解释 4.5 灵敏度问题 4.6 滚动和策略迭代 4.7 截断滚动——前瞻长度问题 4.8 线性二次型问题中的例外行为 4.9 注释与参考文献第5章自适应和模型预测控制 5.1 具有未知参数的系统——鲁棒和PID控制 5.2 值空间近似、滚动和自适应控制 5.3 值空间近似、滚动和模型预测控制 5.4 末端费用近似——稳定性问题 5.5 注释与参考文献第6章有限时段确定性问题——离散优化 6.1 确定性离散空间有限时段问题 6.2 一般离散优化问题 6.3 值空间近似 6.4 离散优化的滚动算法 6.5 采用多步前瞻的滚动——截断滚动 6.6 约束形式的滚动算法 6.7 使用部分可观马尔可夫决策问题模型滚动的自适应控制 6.8 极小化极大控制的滚动 6.9 小阶段费用与长时段——连续时间滚动 6.10 结语附录A 不动点问题的牛顿法 A.1 可微不动点问题的牛顿法 A.2 无须贝尔曼算子可微性的牛顿法参考文献
随便看	论语(玩诵本)/国学玩诵本系列辽宁民营经济发展研究报告(2020) 室内供暖工程施工(高等职业教育活页式系列教材) 中国私募证券投资基金行业发展报告(2021) 中国比较法学(文化网络与司法2020年卷) 粮油食品加工(高等职业教育十四五规划教材) 工业机器人应用系统三维建模(高职高专工业机器人技术专业规划教材) 上海教师(2021年9月第4辑) 管理数学基础(第3版) 书谱书法雅言/国学经典藏书多媒体CAI物理化学(下第6版面向21世纪课程教材) 原理方法与案例--高中地理有效教学/卓越教师教育精品丛书材料力学(普通高等教育农业农村部十三五规划教材) 高等数学(基础篇2023考研专用)/金榜时代考研数学系列科学(新课标ZJ2022浙江专版)/全品中考复习方案大学与学科(2021年第2期季刊) 台湾(2019) 高等学校英语应用能力考试A级新版真题与解析(第2版) 建设工程监理案例分析<土木建筑工程>核心考点掌中宝(2022年版)/全国监理工程师职业资格考试核心考点掌中宝米芾蜀素帖/中国书法宝库电厂热力系统及设备(十三五普通高等教育本科系列教材) 数学(Ⅱ第2轮浙江专用2022)/高中总复习导与练宪法学习百问百答中国共产党第十九届中央委员会第六次全体会议公报卫星导航定位技术文集(2021) 高胜金银行情分析系统 v1.0 浩龙餐饮管理软件 v1.0 九天TIS v5.0 商贸版浩龙酒店管理软件 v2.0 高胜金银MT4软件 v4.0 金达莱餐饮无线点菜管理软件 v8.56 洗衣收银软件 v1.0 普及版建设银行黄金行情分析软件 v7.07.11.57 兴业银行黄金行情分析软件 v7.07.11.57 家庭疾病自测系统 v4.0.2 多玩天涯明月刀盒子 V1.0.9.6 绿色版峰总吃鸡助手 V1.0.0 绿色版 NO Zoomer(nds模拟器放大镜) V2.3.0.2 绿色免费版天命奇御2八十一项修改器 v1.12.28.1 七日杀更便利的人物属性显示MOD v2.53 七日杀硬核模式无地图生存MOD v1.51 流浪汉艰难的生活十一项修改器 V0.17.009 绿色版秘法少女五项修改器 V1.0 绿色版大神绝景版十一项修改器 V1.0 绿色版城市天际线Audi奥迪A6 2021MOD v2.40 dressed dresser dressing dressing-down dressing gown dressing room dressing table dressmaker dress rehearsal dress sense [BT下载][三体][4K高码+全景声][全30集][WEB-MP4/153.66G][中文字幕][4K-2160P][H265][QHstudIo] 剧集 2023 大陆剧情打包 [BT下载][邪恶力量第十二季][全23集][WEB-MKV/66.47G][中文字幕][1080P][BlackTV] 剧集 2016 美国剧情打包 [BT下载][校园阶级风暴][全8集][WEB-MKV/16.10G][简繁英字幕][1080P][Netflix][Huawei] 剧集 2023 印度剧情打包 [BT下载][鬼入侵][全10集][WEB-MKV/49.34G][简繁英字幕][4K-2160P][Netflix][BlackTV] 剧集 2018 美国悬疑打包 [BT下载][大宅门][全40集][WEB-MP4/39.79G][国语配音/中文字幕][4K-2160P][H265][Huawei] 剧集更早大陆剧情打包 [网盘下载][三国演义][84集全][1994年][国语中字][MKV][1440*1080P][无水印] 剧集合集大陆历史全集 [BT下载][托本 Toppen 第一季][全06集][瑞典语中字][MKV][1080P][Amazon Prime] 剧集 2022 瑞典喜剧全集 [BT下载][君子盟][第01-10集][WEB-MP4/3.63G][国语音轨/简繁英字幕][1080P][Xiaomi] 剧集 2023 大陆悬疑连载 [BT下载][A2Z][全10集][WEB-MKV/20.73G][中文字幕][1080P][Amazon][Xiaomi] 剧集 2023 日本其它打包 [BT下载][A2Z][全10集][WEB-MKV/20.73G][中文字幕][1080P][BlackTV] 剧集 2023 日本其它打包 Win10如何快速搜索文件怎么彻底关闭Win10系统的自动更新功能？ Win10激活显示许可证激活(slui.exe)失败错误代码hr=0xC004F074怎么办？ Win10系统CHKDSK只读模式无法检查磁盘怎么办？ Win10系统快速启动提示0xC00000D4错误代码怎么办？ program manager这个应用阻止你重启怎么解决？联想R7000 2000Type-C直连出现兼容性问题怎么办？ Win10无法完成更新正在撤销更改请不要关闭你的计算机怎么办？ Win10蓝屏代码大全详解及解决方法（持续更新） Win10出现IRQL not less or equal蓝屏怎么解决？