![]()
内容推荐 本书介绍了大数据分析中使用的基本数学模型,并对相关实际问题进行了应用参考。本书使用了必要的数学工具,并将它们应用于当前的数据分析问题,进一步跨学科应用于生物学、语言学、社会学、电气工程、计算机科学和人工智能等领域,本书给出的例子包括DNA测序、主题提取、社区检测、压缩感知、垃圾邮件过滤和国际象棋引擎等。对于模型,我们使用了大量的数学知识和方法——从基本的数值线性代数、统计学和优化到更专业的游戏、图甚至复杂性理论。本书涵盖了大数据分析中所有常用的相关技术,在本书中体现为排序、在线学习、推荐系统、分类、聚类、线性回归、稀疏恢复、神经网络和决策树等章节。本书章节的结构和篇幅都是标准化的,以方便学生和教师使用。 目录 第1章 排序 1.1 研究动因:谷歌问题 1.2 研究结果 1.2.1 Perron-Frobenius定理 1.2.2 PageRank 1.3 案例研究:品牌忠诚度 1.4 练习 第2章 在线学习 2.1 研究动因:投资组合选择 2.2 研究结果 2.2.1 在线镜像下降 2.2.2 熵设定 2.3 案例分析:专家建议 2.4 练习 第3章 推荐系统 3.1 研究动因:Netflix大赛 3.2 研究结果 3.2.1 基于近邻的方法 3.2.2 基于模型的方法 3.3 案例分析:潜在语义分析 3.4 练习 第4章 分类 4.1 研究动因:信用调查 4.2 研究结果 4.2.1 Fisher判别规则 4.2.2 支持向量机 4.3 案例分析:质量控制 4.4 练习 第5章 聚类 5.1 研究动因:DNA测序 5.2 研究结果 5.2.1 七一均值算法 5.2.2 谱聚类 5.3 案例分析:主题抽取 5.4 练习 第6章 线性回归 6.1 研究动因:计量经济学分析 6.2 研究结果 6.2.1 最小二乘法 6.2.2 岭回归 6.3 案例分析:资本资产定价 6.4 练习 第7章 稀疏恢复 7.1 研究动因:变量选择 7.2 研究结果 7.2.1 Lasso回归 7.2.2 迭代阈值收缩算法 7.3 案例分析:压缩感知 7.4 练习 第8章 神经网络 8.1 研究动因:神经细胞 8.2 研究结果 8.2.1 逻辑回归 8.2.2 感知机 8.3 案例分析:垃圾邮件过滤 8.4 练习 第9章 决策树 9.1 研究动因:泰坦尼克号幸存率 9.2 研究结果 9.2.1 NP完全性 9.2.2 自上而下的和自下而上的启发式算法 9.3 案例研究:国际象棋引擎 9.4 练习 第10章 练习题解 10.1 排序 10.2 在线学习 10.3 推荐系统 10.4 分类 10.5 聚类 10.6 线性回归 10.7 稀疏恢复 10.8 神经网络 10.9 决策树 参考文献 索引 英文索引 |