![]()
内容推荐 本书是一本全面介绍数据挖掘技术的专业书籍,系统地阐述了数据挖掘的相关概念、原理、算法思想和算法的Python代码实现。全书共分13章,各章相对独立成篇,以利于读者选择性学习。13章内容分别为绪论、pandas数据处理、认识数据、数据预处理、决策树分类、贝叶斯分类、支持向量机分类、感知器分类、回归、聚类、关联规则挖掘、推荐系统、电商评论网络爬取与情感分析。 本书可作为高等院校计算机科学与技术、数据科学与大数据及相关专业的数据挖掘、数据分析课程教材,亦可作为数据挖掘、数据分析人员的参考书。 作者简介 曹洁,博士,毕业于同济大学电子与信息工程学院计算机软件与理论专业;主要研究方向是并行分布式处理、云计算、大数据;主持和参与国家级、省部级项目5项;在《软件学报》《计算机研究与发展》《通信学报》等国内外核心刊物上发表学术论文12篇;主讲“Python语言程序设计”“大数据技术及应用”“云计算技术”等课程;主编《Python语言程序设计》(微课版),参编《数据挖掘》《Struts2+Hibermate框架技术教程》(第2版)等多部教材。 目录 第1章 绪论 1.1 数据挖掘的相关概念 1.2 数据挖掘的步骤 1.3 数据挖掘的典型应用 1.3.1 数据挖掘在市场营销中的应用 1.3.2 数据挖掘在企业危机管理中的应用 1.4 数据挖掘的主要挑战 1.4.1 数据挖掘查询语言 1.4.2 用户交互 1.4.3 并行、分布和增量挖掘算法 1.4.4 数据类型的多样化 1.5 本章小结 第2章 pandas数据处理 2.1 Series对象 2.1.1 Series对象的创建 2.1.2 Series对象的属性 2.1.3 Series对象的查看和修改 2.2 Series对象的基本运算 2.2.1 算术运算与函数运算 2.2.2 Series对象之间的运算 2.3 DataFrame对象 2.3.1 DataFrame对象的创建 2.3.2 DataFrame对象的属性 2.3.3 查看和修改DataFrame对象的元素 2.3.4 判断元素是否属于DataFrame对象 2.4 DataFrame对象的基本运算 2.4.1 数据筛选 2.4.2 数据预处理 2.4.3 数据运算与排序 2.4.4 数学统计 2.4.5 数据分组与聚合 2.5 pandas数据可视化 2.5.1 绘制折线图 2.5.2 绘制条形图 2.6 pandas读写数据 2.6.1 读写csv文件 2.6.2 读取txt文件 2.6.3 读写Excel文件 2.7 本章小结 第3章 认识数据 3.1 数据类型 3.1.1 属性类型 3.1.2 数据集的类型 3.2 数据质量分析 3.2.1 缺失值分析 3.2.2 异常值分析 3.2.3 一致性分析 3.3 数据特征分析 3.3.1 分布特征 3.3.2 统计量特征 3.3.3 周期性特征 3.3.4 相关性特征 3.4 本章小结 第4章 数据预处理 4.1 数据清洗 4.1.1 处理缺失值 4.1.2 噪声数据处理 4.2 数据集成 4.2.1 实体识别问题 4.2.2 属性冗余问题 4.2.3 元组重复问题 4.2.4 属性值冲突问题 4.3 数据规范化 4.3.1 最小-最大规范化 4.3.2 z分数规范化 4.3.3 小数定标规范化 …… 第5章 决策树分类 第6章 贝叶斯回归 第7章 支持向量机分类 第8章 感知器分类 第9章 回归 第10章 聚类 第11章 关联规则挖掘 第12章 推荐系统 第13章 电商评论网络爬取与情感分析 参考文献 |