内容推荐 本书主要围绕推荐系统进行讲解,全面介绍了掌握推荐系统技术所需要学习的算法及步骤。书中描述了基于点击率评估、RBM的推荐,基于标签的推荐,基于用户行为、内容、模型、流行度、邻域、图的推荐,以及基于上下文的推荐,还有使用自然语言处理或者矩阵分解的推荐,包括算法原理的介绍,对于每一种推荐方式也做了细粒度的分析及场景化的应用。还分享了作者在实际应用中的解决方案及扩展思路。除此之外,本书还会涉及一些基础算法及数学知识,并且包括对于推荐算法的一些模型评估以及校验的描述。阅读本书可以帮助读者学习基础算法和推荐算法的原理及实际应用,同时还能学习到推荐系统开发的设计思想、设计模式、开发流程等。这些对于读者全面提高自己的推荐系统开发水平有很大的帮助。 本书为读者提供了全部案例源代码下载和超过1100分钟的高清学习视频,读者可直接扫描二维码观看。 本书适合从事推荐系统相关领域研发的人员、高年级本科生或研究生、热衷于推荐系统开发的读者阅读。 作者简介 吕倩倩,女,2018年毕业于沈阳航空航天大学软件工程专业,获工学学士学位。原商品交易所大数据开发工程师,现任花旗银行大数据开发工程师。2015年获得ACM-ICPC大赛三等奖;2016年获得美国数学建模竞赛一等奖、亚太数学建模二等奖,并多次获得全国大学生数学建模竞赛一等奖、二等奖;2018年获得阿里云ACA认证证书。 目录 第1部分 推荐系统介绍篇 第1章 推荐系统概述 1.1 什么是推荐系统 1.2 推荐系统的架构 1.3 推荐系统架构治理 1.4 推荐引擎的架构 1.5 推荐系统的应用 1.5.1 电影和视频网站 1.5.2 个性化音乐电台 1.5.3 个性化广告及搜索广告 1.5.4 多业务融合推荐策略实践与思考 1.6 推荐系统评测 1.6.1 推荐系统实验方法 1.6.2 评测指标 1.6.3 评测维度 1.7 推荐系统知识储备 第2部分 推荐系统基础篇 第2章 机器学习准备工作 2.1 机器学习绪论 2.1.1 数据积累 2.1.2 特征(过滤法、包装法、嵌入法) 2.1.3 模型的不可解释性 2.2 数学基础知识 2.2.1 微积分 2.2.2 统计学 2.2.3 线性代数 2.2.4 信息论基础 2.2.5 凸优化 2.3 Python编程 第3章 机器学习基础——让推荐系统更懂你 3.1 贝叶斯分类器 3.1.1 贝叶斯决策论 3.1.2 大似然估计 3.1.3 EM算法 3.1.4 垃圾邮件过滤实战 3.2 决策树 3.3 支持向量机(SVM) 3.3.1 SVM介绍 3.3.2 半监督SVM 3.4 KNN算法 3.5 线性回归 3.6 逻辑回归 3.7 Spark MLlib 3.7.1 Spark MLlib简介 3.7.2 Spark MLlib矩阵计算 3.7.3 Spark MLlib实现分类算法 3.7.4 Spark MLlib实现回归算法 3.7.5 Spark MLlib实现聚类算法 3.8 聚类任务 3.8.1 k均值聚类算法 3.8.2 高斯混合聚类 第3部分 推荐系统进阶篇 第4章 基于点击率预估、RBM的推荐 4.1 传统推荐算法的局限和应用 4.1.1 传统推荐算法的局限 4.1.2 传统推荐算法的应用 4.1.3 点击率预估在推荐系统中的应用 4.2 集成学习(Ensemble Learning) 4.2.1 GBDT 4.2.2 XgBoost 4.2.3 Bagging与随机森林 4.3 实例:基于RBM的推荐算法 第5章 基于标签的推荐 5.1 基于标签系统的应用 5.2 数据标注与关键词提取 5.2.1 推荐系统中的数据标注 5.2.2 推荐系统中的关键词提取 5.2.3 标签的分类 5.3 基于标签的推荐系统 5.3.1 标签评分算法 5.3.2 标签评分算法改进 5.3.3 标签基因 5.3.4 用户兴趣建模 5.4 实例:使用标签推荐算法实现艺术家的推荐 5.4.1 了解实现思路 5.4.2 准备数据 5.4.3 选择算法 5.4.4 模型训练 5.4.5 效果评估 第6章 推荐算法 6.1 基于内容的推荐算法 6.2 基于用户行为特征的推荐算法 6.2.1 User-Based CF详解及优化 6.2.2 Item-Based CF详解及优化 6.2.3 融合Match中协同过滤思想的深度排序模型 6.3 基于模型的推荐算法 6.4 基于流行度的推荐算法 6.5 混合算法 6.6 基于图的模型 6.6.1 用户行为数据的二分图表示 6.6.2 基于图的推荐算法 6.7 基于社交网络的推荐 6.7.1 基于邻域的社会化推荐算法 6.7.2 基于图的社会化推荐算法 6.8 Slope-one推荐算法 6.9 基于DNN的推荐算法介绍 6.10 基于TF实现稀疏自编码和在推荐中的应用 6.11 联邦推荐算法及应用 第7章 推荐系统冷启动及召回方法 7.1 冷启动问题简介 7.2 选择合适的物品启动用户的兴趣 7.3 利用物品的内容信息 7.4 Multi-View DNN模型解决用户冷启动 第4部分 推荐系统强化篇 第8章 基于上下文的推荐 8.1 基于时间特征的推荐 8.1.1 时间效应介绍 8.1.2 推荐系统的实时性 8.1.3 协同过滤中的时间因子 8.2 实例:增加时间衰减函数的协同过滤算法 8.2.1 在UserCF算法中增加时间衰减函数 8.2.2 在ItemCF算法中增加时间衰减函数 第9章 文本处理 9.1 Word2Vec 9.1.1 Word2Vec简介 9.1.2 词向量 9.1.3 分层优化语言模型 9.1.4 连续词袋模型 9.2 fastText 9.2.1 模型架构 9.2.2 层次Softmax 9.2.3 N-Gram子词特征 9.2.4 fastText和Word2Vec的区别 9.2.5 使用fastText分类 9.3 Gensim 9.3.1 Gensim基本概念 9.3.2 Gensim的安装及简单使用 9.3.3 主题向量的转化:TF-IDF(词频逆文档频率) 9.3.4 主题向量的转化:LSA(潜在语义分析) 9.3.5 主题向量的转化:LDA(隐含狄利克雷分配) 9.4 NLTK 9.4.1 NLTK的介绍 9.4.2 NLTK的安装及信息提取 第10章 使用矩阵分解的推荐 10.1 Spark ALS 10.1.1 |