第1章 经典的探索性数据分析案例
1.1 探索性数据分析综述
1.1.1 什么是探索性数据分析
1.1.2 如何收集数据
1.1.3 数据预处理技术
1.2 数据巧收集——红牛的大数据营销案例
1.2.1 状况百出的红牛企业
1.2.2 红牛企业巧妙收集消费者数据
1.2.3 数据收集小结
1.3 数据可视化——数据新闻促使英军撤军
1.3.1 维基解密带来的海量数据
1.3.2 百花齐放的数据新闻
1.3.3 数据可视化小结
1.4 异常值分析——Facebook消灭钓鱼链接
1.4.1 Facebook和广告商之间的拉锯战
1.4.2 异常值分析指导排名算法工作
1.4.3 异常值分析小结
1.5 对比分析——TrueCar指导购物者寻找最合算的车价
1.5.1 火中取栗的TrueCar网站
1.5.2 数据对比赢得消费者信赖
1.5.3 对比分析小结
第2章 经典的相关分析与回归分析案例
2.1 相关回归综述
2.1.1 相关回归简介
2.1.2 相关性分析的发展介绍
2.1.3 回归分析的发展介绍
2.2 皮尔逊相关值——纽约市政府利用相关分析监控违法建筑
2.2.1 简约而不简单的消防检测系统
2.2.2 使用相关分析洞察60个变量的关系
2.2.3 相关分析小结
2.3 时间序列分析——人寿保险的可提费用预测
2.3.1 人寿保险公司和可提费用
2.3.2 使用4种时间序列回归预测模型解决问题
2.3.3 时间序列分析小结
2.4 线性回归分析——梅西百货公司的12项大数据策略
2.4.1 从“一亿豪赌”说起的零售商困境
2.4.2 SAS公司帮助梅西百货构建模型
2.4.3 线性回归分析小结
2.5 Logistic回归分析——大面积流感爆发的预测分析
2.5.1 究竟谁才是流感预测算法之王
2.5.2 向Logistic算法中引入更多变量
2.5.3 Logistic回归分析小结
第3章 经典的降维数据分析案例
3.1 降维分析算法综述
3.1.1 为什么要使用降维算法
3.1.2 线性降维算法
3.1.3 非线性降维算法
3.2 粗糙集算法——协助希腊工业发展银行制定信贷政策
3.2.1 银行信贷政策的制定原则
3.2.2 粗糙集算法的原理和应用
3.2.3 粗糙集算法小结
3.3 因子分析——基于李克特量表的应聘评价法
3.3.1 源于智力测试的因子分析
3.3.2 使用因子分析解构问卷
3.3.3 因子分析小结
3.4 最优尺度分析——直观评估消费者倾向的分析方法
3.4.1 市场调查问题催生的最优尺度分析
3.4.2 6种经典的最优尺度分析解读方法
3.4.3 最优尺度分析小结
3.5 PCA降维算法——智能人脸识别的应用与拓展
3.5.1 刷脸的时代来了
3.5.2 使用PCA算法完成降维工作
3.5.3 PCA算法小结
第4章 经典的模式识别案例
4.1 模式识别综述
4.1.1 模式识别简介
4.1.2 模式识别的发展脉络
4.1.3 模式识别应用简介
4.2 图像分析——谷歌的超前自动驾驶技术
4.2.1 以安全的名义呼吁自动驾驶技术
4.2.2 快速成熟的无人驾驶技术
4.2.3 图像分析小结
4.3 遗传算法——经典的人力资源优化问题
4.3.1 使用有限资源实现利益最大化
4.3.2 遗传算法的计算过程
4.3.3 遗传算法小结
4.4 决策树分析——“沸腾时刻”准确判断用户健康水平
4.4.1 打造我国最大的健身平台
4.4.2 信息增益和决策树
4.4.3 决策树小结
4.5 K均值聚类分析——HSE24通过为客户分类降低退货率
4.5.1 在电子商务市场快速扩张的HSE24
4.5.2 使用K均值聚类为客户分类
4.5.3 K均值聚类小结
第5章 经典的机器学习案例
5.1 机器学习综述
5.1.1 机器学习简介
5.1.2 机器学习的主流发展和应用
5.2 语义搜索——沃尔玛搜索引擎提升15%销售额
5.2.1 注重用户体验的沃尔玛公司
5.2.2 语义搜索引擎的底层技术和原理
5.2.3 语义搜索技术小结
5.3 顺序分析——搜狗输入法的智能纠错系统
5.3.1 搜狗输入法的王牌词库和智能算法
5.3.2 频繁树模式和顺序分析算法
5.3.3 顺序分析小结
5.4 文本分析——经典的垃圾邮件过滤系统
5.4.1 大数据时代需要文本分析工作
5.4.2 垃圾邮件过滤中的分词技术和词集模型
5.4.3 文本分析小结
5.5 协同过滤——构建个性化推荐系统的经典算法
5.5.1 协同过滤算法为什么这么流行
5.5.2 基于用户和基于产品的协同过滤
5.5.3 协同过滤算法小结
第6章 经典的深度学习案例
6.1 深度学习综述
6.1.1 深度学习简介
6.1.2 深度学习在图像处理方面的应用
6.1.3 深度学习在自然语言处理方面的应用
6.2 支持向量机——乔布斯利用大数据对抗癌症
6.2.1 乔布斯和胰腺癌的抗争
6.2.2 医学统计学和支持向量机
6.2.3 支持向量机小结