内容推荐 这是一本营销和广告数据挖掘与分析的实战指南,横跨技术和业务两个维度,理论与实践相结合。技术维度,结合营销与广告行业的实际需求,系统讲解了广告数据挖掘的模型、算法以及数据分析方法,以实现面向用户的精准营销;业务维度,结合广告业务的具体场景,为广告中的具体问题提供解决方案。更重要的是,本书还讲解了热门的机器学习算法在广告数据挖掘与分析中的应用。 全书共10章,从逻辑上可分为技术理论知识和具体业务应用两个部分。前6章以及第10章主要讲解了广告数据挖掘与分析的技术、方法和应用,第7~9章则主要讲解了广告业务中的具体问题及相应的解决方法。 第1~2章主要介绍了Python的安装和环境配置,以及广告数据和广告数据分析的基础知识。 第3~6章深入讲解了Python常用的工具包、模型常用的评价指标,以及如伺利用Python建立广告分类模型和集成模型。 第7~8章讲解了广告数据分析的典型案例和常用分析方法,以及如何做一份满意的数据分析报告。 第9章讲解了如伺运用数据挖掘与分析方法解决广告业务中的实际问题。 第10章主要讲解了常用的数据预处理及特征选择方法。 作者简介 杨游云,资深数据分析师和AI技术专家,在广告领域从业多年,目前就职于微思敦深圳分公司皓量科技。在AI技术领域有非常深厚的积累,擅长机器学习和自然语言处理,对图像识别技术也有一定的研究。 个人微信公众号:数据挖掘与AI算法。 目录 前言 第1章 Python安装方法 1.1 Python介绍 1.1.1 Python的由来 1.1.2 Python的特点 1.2 Anaconda安装 1.3 PyCharm安装及环境配置 1.3.1 PyCharm安装 1.3.2 PyCharm环境配置 1.4 为什么建议使用Python 1.5 本章小结 第2章 认识广告数据分析 2.1 广告数据概述 2.1.1 广告数据的特点 2.1.2 广告数据分析的意义 2.2 广告数据分布 2.2.1 伯努利分布 2.2.2 均匀分布 2.2.3 二项分布 2.2.4 正态分布 2.2.5 泊松分布 2.2.6 指数分布 2.3 异常值诊断 2.3.1 三倍标准差法 2.3.2 箱形图分析法 2.4 数据相关性 2.4.1 Pearson相关系数 2.4.2 Spearman秩相关系数 2.5 显著性检验 2.6 本章小结 第3章 Python广告数据分析常用工具包 3.1 数据基础运算工具:NumPy 3.1.1 常见数据结构 3.1.2 索引与切片 3.1.3 数组运算 3.1.4 矩阵运算 3.1.5 广播 3.1.6 其他常用操作 3.2 数据预处理工具:Pandas 3.2.1 数据结构概述 3.2.2 数据加载 3.2.3 数据拼接 3.2.4 数据聚合 3.2.5 数据透视表和交叉表 3.2.6 广告缺失值处理 3.3 数据可视化分析工具:Matplotlib 3.3.1 散点图 3.3.2 条形图 3.3.3 折线图 3.3.4 饼图 3.3.5 直方图 3.3.6 箱形图 3.3.7 组合图 3.4 本章小结 第4章 模型常用评价指标 4.1 回归模型常用评价指标 4.1.1 R2 4.1.2 调整后的R2 4.2 分类模型常用评价指标 4.2.1 混淆矩阵 4.2.2 ROC曲线 4.2.3 AUC 4.2.4 KS指标 4.2.5 提升度 4.3 本章小结 第5章 利用Python建立广告分类模型 5.1 逻辑回归 5.1.1 逻辑回归原理 5.1.2 损失函数 5.1.3 利用Python建立逻辑回归 5.2 决策树 5.2.1 决策树概述 5.2.2 决策树算法 5.2.3 决策树剪枝处理 5.2.4 决策树的实现 5.3 KNN 5.3.1 距离度量 5.3.2 KNN算法原理 5.3.3 KNN算法中K值的选取 5.3.4 KNN中的一些注意事项 5.3.5 KNN分类算法实现 5.4 SVM 5.4.1 最大间隔超平面 5.4.2 支持向量 5.4.3 目标函数 5.4.4 软间隔最大化 5.4.5 核函数 5.4.6 SVM算法的应用 5.5 神经网络 5.5.1 结构特点 5.5.2 训练过程 5.5.3 激活函数 5.5.4 损失函数 5.5.5 神经网络的实现 5.6 本章小结 第6章 利用Python建立广告集成模型 6.1 随机森林 6.1.1 随机森林的Bagging思想 6.1.2 随机森林的生成及优点 6.1.3 袋外误差 6.1.4 Scikit-learn随机森林类库介绍 6.1.5 随机森林模型的实现 6.2 GBDT 6.2.1 GBDT算法思想 6.2.2 GBDT算法原理 6.2.3 Scikit-learn GBDT类库介绍 6.2.4 使用Scikit-learn类库实现GBDT算法 6.3 XGBoost 6.3.1 XGBoost算法思想 6.3.2 XGBoost算法原理 6.3.3 XGBoost算法的优点 6.3.4 XGBoost类库参数 6.3.5 使用Scikit-learn类库实现XGBoost算法 6.4 Stacking 6.4.1 Stacking算法思想 6.4.2 Stacking算法原理 6.4.3 Stacking算法实现 6.5 LR+GBDT 6.5.1 LR+GBDT原理 6.5.2 LR+GBDT在广告CTR中的应用 6.5.3 LR+GBDT算法实现 6.6 FM 6.6.1 FM的原理 6.6.2 FM的改进 6.6.3 FM的Python实现 6.7 本章小结 第7章 移动广告常用数据分析方法 7.1 App下载数据分析 7.2 游戏行业用户分析 7.2.1 游戏行业数据分析的作用 7.2.2 游戏行业的关键数据指标 7.2.3 游戏用户数据分析方法 7.3 电商类App用户转化分析 7.4 工具类App用户分析 7.5 本地O2O婚纱摄影行业分析 7.5.1 精准人群定向 7.5.2 广告创意素材 7.6 品牌广告与效果广告 7.7 本章小结 第8章 广告数据分析报告 8.1 分析观点明确,逻辑清晰 8.2 汇报结果,用数据说话 8.3 分析过程有理有据 8.4 图表说明 8.5 数据验证 8.6 分析建议 8.7 本章小结 第9章 广告用户数据挖掘与分析 9.1 广告用户曝光与响应率分析 9.2 广告用户曝光与点击率分析 9.3 广告订单消耗与延时性分析 9.3.1 Budget Smooth算法 9.3.2 Budget Smooth的系统设计 9.4 Lookalike聚类分析 9.4.1 Lookalike概述 9.4.2 K-means聚类 9.4.3 K-means算法的过程 9.4.4 K-means算法的实现 9.5 Lookalike技术在广告中的应用 9.5.1 Lookalike的基本流程 9.5.2 微信社交中的Lookalike应用 9 |