![]()
内容推荐 本书主要讲解推荐系统中的召回算法和排序算法,以及各个算法在主流工具Sklearn、Spark、TensorFlow等中的实现和应用。 书中本着循序渐进的原则进行讲解。首先,介绍推荐系统中推荐算法的数学基础,推荐算法的平台、工具基础,以及具体的推荐系统。其次,对推荐系统中的召回算法进行讲解,主要包括基于行为相似的协同过滤召回和基于内容相似的Word2vec召回,并且介绍其在Spark、TensorFlow主流工具中的实现与应用。再次,讲解推荐系统中的排序算法,包括线性模型、树模型和深度学习模型,分别介绍逻辑回归、FM、决策树、随机森林、GBDT、GBDT+LR、集成学习、深度森林、DNN、Wide & Deep、DeepFM、YouTube推荐等模型的原理,以及其在Sklearn、Spark、TensorFlow主流工具中的实现与应用。最后,介绍推荐算法的4个实践案例,帮助读者进行工程实践和应用,并且介绍如何在Notebook上进行代码开发和算法调试,以帮助读者提升工作效率。 本书适合AI、数据挖掘、大数据等领域的从业人员阅读,书中为开发者展现了推荐算法的原理、实现与应用案例。 作者简介 黄美灵,现任一线互联网公司的高级工程师,拥有多年大型互联网公司推荐系统和机器学习实战经验,现从事广告推荐、应用分发和资讯Feeds流推荐相关工作。 目录 第1部分 推荐系统的算法基础 第1章 数学基础 1.1 线性代数 1.2 概率与统计 1.3 损失函数 1.4 优化方法 1.4.1 SGD 1.4.2 动量 1.4.3 Nesterov动量 1.4.4 AdaGrad 1.4.5 Adam 1.4.6 L-BFGS 1.4.7 梯度法和牛顿法的比较 1.5 评价方法 1.5.1 混淆矩阵 1.5.2 ROC曲线 第2章 推荐系统介绍 2.1 推荐系统背景 2.2 推荐系统的典型案例 2.2.1 Amazon推荐 2.2.2 Facebook推荐 2.2.3 YouTube推荐 2.3 推荐系统原理 第3章 推荐算法工具 3.1 Python Sklearn机器学习库 3.1.1 Sklearn介绍 3.1.2 Sklearn建模流程 3.2 Spark MLlib机器学习库 3.2.1 MLlib介绍 3.2.2 MLlib建模流程 3.3 TensorFlow 3.3.1 TensorFlow介绍 3.3.2 TensorFlow建模流程 3.4 Notebook介绍 3.4.1 Zeppelin Notebook介绍 3.4.2 Jupyter Notebook介绍 第2部分 推荐系统的召回算法 第4章 协同过滤——基于行为相似的召回 4.1 协同过滤算法 4.1.1 协同过滤推荐概述 4.1.2 用户评分 4.1.3 相似度计算 4.1.4 推荐计算 4.2 协同过滤推荐算法实现 4.2.1 相似度计算及推荐计算 4.2.2 协同推荐 4.2.3 运行结果 第5章 Word2vec——基于内容相似的召回 5.1 Word2vec算法 5.1.1 语言模型 5.1.2 CBOW One-Word Context模型 5.1.3 CBOW Multi-Word Context模型 5.1.4 Skip-Gram模型 5.1.5 Hierarchical Softmax 5.1.6 Negative Sampling 5.2 Word2vec实例 5.2.1 Spark实现 5.2.2 TensorFlow实现 第3部分 推荐系统的排序算法——线性模型 第6章 逻辑回归 6.1 逻辑回归算法 6.1.1 二元逻辑回归模型 6.1.2 模型参数估计 6.1.3 多元逻辑回归模型(Softmax回归) 6.1.4 逻辑回归的网络结构 6.1.5 梯度下降算法 6.1.6 正则化 6.2 逻辑回归实现 6.2.1 Sklearn实现 6.2.2 Spark实现 6.2.3 TensorFlow实现 6.2.4 效果总结 第7章 因子分解机(FM) 7.1 FM算法 7.1.1 FM模型 7.1.2 FFM模型 7.1.3 FM模型的网络结构 7.2 FM实现 7.2.1 Sklearn实现 7.2.2 TensorFlow实现 7.2.3 效果总结 第4部分 推荐系统的排序算法——树模型 第8章 决策树 8.1 决策树算法 8.1.1 决策树模型 8.1.2 特征选择 8.1.3 决策树的生成 8.1.4 决策树的生成实例 8.1.5 决策树的剪枝 8.2 决策树的集成算法 8.2.1 集成分类器 8.2.2 随机森林 8.2.3 GBDT 8.3 决策树集成算法实例 8.3.1 Spark实现 8.3.2 Sklearn实现 8.3.3 效果总结 第9章 集成学习 9.1 GBDT+LR算法 9.1.1 背景 9.1.2 GBDT+LR网络结构 9.2 深度森林算法 9.2.1 深度森林介绍 9.2.2 级联森林 9.2.3 多粒度扫描 9.3 决策树集成分类器 9.4 集成学习实例 9.4.1 GBDT+LR实现 9.4.2 深度森林实现 9.4.3 效果总结 第5部分 推荐系统的排序算法——深度学习模型 第10章 深度学习在推荐算法中的应用 10.1 推荐模型的特点 10.2 基于深度学习的推荐模型 10.2.1 DNN优化高阶特征 10.2.2 高阶特征交叉与低阶特征交叉 10.2.3 特征交叉优化 10.2.4 特征连接优化 10.2.5 高阶特征交叉优化 10.2.6 多样性的深度兴趣特征优化 第11章 DNN算法 11.1 人工神经网络算法 11.1.1 神经元 11.1.2 神经网络模型 11.1.3 信号的前向传播 11.1.4 误差的反向传播 11.2 DNN优化方法 11.2.1 优化参数 11.2.2 Attention机制 11.3 DNN实例 11.4 运行结果 第12章 Wide & Deep模型 12.1 Wide & Deep模型概述 12.1.1 Wide模型 12.1.2 Deep模型 12.1.3 模型联合训练 12.2 Wide & Deep系统实现 12.2.1 推荐系统介绍 12.2.2 系统流程 12.2.3 训练数据的生成 12.2.4 模型训练 12.2.5 线上应用 12.3 Wide & Deep实例 12.4 运行结果 第13章 DeepFM模型 13.1 DeepFM模型概述 13.1.1 FM组件 13.1.2 Deep组件 13.1.3 模型对比 13.2 DeepFM模型实例 13.3 运行结果 |