网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 强化学习实战(强化学习在阿里的技术演进和业务创新)/阿里技术丛书系列
分类
作者 笪庆//曾安祥
出版社 电子工业出版社
下载
简介
内容推荐
笪庆、曾安祥编著的《强化学习实战(强化学习在阿里的技术演进和业务创新)》汇集了阿里巴巴一线算法工程师在强化学习应用方面的经验和心得,覆盖了搜索事业部、阿里妈妈事业部、计算平台事业部以及智能服务事业部等多条业务线,工业界首次系统地披露了强化学习在互联网级别的应用上使用的技术细节,其中更包含了阿里巴巴的算法工程师对强化学习的深入理解、思考和创新。本书主要面向算法工程师,强化学习方向的研究人员以及所有机器学习爱好者。作为算法工程师,你将了解强化学习在实际应用中的建模方法,常见的问题以及对应的解决思路,提高建模和解决业务问题的能力;作为强化学习方向的研究人员,你将了解到在游戏之外更多实际的强化学习问题以及对应的解决方案,扩宽研究视野;作为机器学习爱好者,你将了解到阿里巴巴的一线机器学习算法工程师是如何发现问题,定义问题和解决问题的,激发研究兴趣以及提升专业素养。
本书适合算法工程师、强化学习方向的专业人员阅读,也可供机器学习爱好者参考。
目录

第1章 强化学习基础
1.1 引言
1.2 起源和发展
1.3 问题建模
1.4 常见强化学习算法
1.4.1 基于值函数的方法
1.4.2 基于直接策略搜索的方法
1.5 总结
第2章 基于强化学习的实时搜索排序策略调控
2.1 研究背景
2.2 问题建模
2.2.1 状态定义
2.2.2 奖赏函数设计
2.3 算法设计
2.3.1 策略函数
2.3.2 策略梯度
2.3.3 值函数的学习
2.4 奖赏塑形
2.5 实验效果
2.6 DDPG与梯度融合
2.7 总结与展望
第3章 延迟奖赏在搜索排序场景中的作用分析
3.1 研究背景
3.2 搜索交互建模
3.3 数据统计分析
3.4 搜索排序问题形式化
3.4.1 搜索排序问题建模
3.4.2 搜索会话马尔可夫决策过程
3.4.3 奖赏函数
3.5 理论分析
3.5.1 马尔可夫性质
3.5.2 折扣率
3.6 算法设计
3.7 实验与分析
3.7.1 模拟实验
3.7.2 搜索排序应用
第4章 基于多智能体强化学习的多场景联合优化
4.1 研究背景
4.2 问题建模
4.2.1 相关背景简介
4.2.2 建模方法
4.3 算法应用
4.3.1 搜索与电商平台
4.3.2 多排序场景协同优化
……
第5章 虚拟淘宝
第6章 组合优化视角下基于强化学习的精准定向广告OCPC业务优化
第7章 策略优化方法在搜索广告排序和竞价机制中的应用
第8章 TaskBot——阿里小蜜的任务型问答技术
第9章 DRL导购——阿里小蜜的多轮标签推荐技术
第10章 RobustDQN在淘宝锦囊推荐系统中的应用
第11章 基于上下文因子选择的商业搜索引擎性能优化
第12章 基于深度强化学习求解一类新型三维装箱问题
第13章 基于强化学习的分层流量调控
第14章 风险商品流量调控
参考文献
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/4 10:16:11