内容推荐 作为近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,大数据分析与挖掘已经成为各个行业商业决策的必备技术。本书紧跟数据科学前沿,旨在帮助读者建立大数据分析与挖掘的思维框架,培养其使用数据驱动的方法解决商业决策问题的能力。本书秉承经典、主流和发展的理念,重点介绍了大数据分析与挖掘的主要步骤,关联分析、分类和聚类等经典算法的原理以及文本挖掘和深度学习等最新算法和应用。本书内容设计采用“算法原理+商业案例”的方式,突出课程的实践性和应用性特点。 本书适合作为开设数据挖掘、机器学习及大数据分析类课程的高校课程教材,也可作为从事数据挖掘开发、高级数据分析的企事业单位工作人员以及从事大数据分析应用研究的科研人员的参考书。 作者简介 刘伟,东北财经大学管理科学与工程学院教授、博士生导师,辽宁省一流本科课程“管理信息系统”“数据挖掘与商务智能”课程负责人。主要研究方向为数字化创新与组织战略,大数据与社会化创新、数据挖掘与商务智能。主讲课程为管理信息系统、数据挖掘与商务智能、信息技术战略与管理、信息系统研究的理论与方法。入选辽宁省“百千万”人才工程百人层次、辽宁省高等学校优秀人才支持计划、辽宁省高等学校创新人才支持计划、辽宁省优秀研究生导师。在《管理世界》《系统工程理论与实践》《中国管理科学》和International Journal of Production Research、IEEE Transactions on Engineering Management等期刊发表论文60余篇。主持国家社会科学基金项目等课题20余项。出版学术专著3部。主编《管理信息系统》等教材3部。 目录 第1章 大数据分析与挖掘概论 1.1 大数据及其应用 1.2 大数据分析与挖掘的相关概念 1.3 大数据分析与挖掘的模式 1.4 大数据分析与挖掘技术 课后习题 应用实例 即测即练 第2章 数据预处理 2.1 数据类型 2.2 数据的邻近性度量 2.3 数据预处理过程 2.4 数据预处理方法 课后习题 应用实例 即测即练 第3章 特征工程与降维 3.1 特征工程 3.2 降维方法 课后习题 应用实例 即测即练 第4章 关联分析 4.1 关联规则的概念 4.2 Apriori算法 4.3 FPGrowth算法 4.4 关联规则评价 课后习题 应用实例 即测即练 第5章 回归分析 5.1 回归分析概述 5.2 线性回归 5.3 线性回归正则化 5.4 逻辑回归 课后习题 应用实例 即测即练 第6章 分类 6.1 分类方法概述 6.2 决策树分类 6.3 朴素贝叶斯 6.4 k最近邻 6.5 支持向量机 6.6 模型评估与选择 课后习题 应用实例 即测即练 第7章 集成分类方法 7.1 集成分类方法概述 7.2 Boosting 7.3 Bagging 课后习题 应用实例 即测即练 第8章 聚类 8.1 聚类概述 8.2 基于划分的聚类方法 8.3 基于层次的聚类方法 8.4 基于密度的聚类方法 8.5 基于网格的聚类方法 8.6 基于模型的聚类方法 8.7 聚类评估 课后习题 应用实例 即测即练 第9章 文本挖掘 9.1 文本挖掘概述 9.2 文本表示方法 9.3 文本降维 9.4 主题分析 9.5 情感分析 课后习题 应用实例 即测即练 第10章 神经网络与深度学习 10.1 深度学习概述 10.2 多层感知机 10.3 反向传播算法 10.4 卷积神经网络 10.5 循环神经网络 10.6 深度学习方法的优化 课后习题 应用实例 即测即练 参考文献 |