内容推荐 本书主要介绍数据分析与挖掘的相关理论和技术方法,重点介绍数据挖掘的相关技术,书中采取理论知识与具体实现任务相结合的方法,系统讲解了数据分析与挖掘的实用技术。全书主要内容包括数据分析与数据挖掘概论、数据仓库与联机分析处理、数据预处理、关联规则挖掘、聚类分析、回归分析、决策树分析、SPSS数据挖掘基础、SPSS数据挖掘统计分析方法。为了使学习者能轻松掌握数据分析与挖掘相关的概念、算法和应用,本书通过典型的应用实例以任务驱动的方式让学习者理解数据挖掘有关算法的实践思路并体验实现过程。 本书可作为计算机、大数据、智能科学等专业的课程的教材使用,也可以作为从事大数据分析与数据挖掘等相关工作技术人员的参考书。 目录 第1章 数据分析与数据挖掘概论 1.1 数据分析 1.1.1 数据分析的定义 1.1.2 数据分析的工具 1.1.3 数据分析的方法与案例 1.2 数据挖掘 1.2.1 数据挖掘的定义 1.2.2 数据挖掘的目的 1.2.3 数据挖掘的工具 1.2.4 数据挖掘的方法和经典算法 小结 思考题 第2章 数据仓库与联机分析处理 2.1 数据仓库 2.1.1 数据仓库的定义和特点 2.1.2 数据仓库与数据库的区别 2.1.3 数据仓库的系统结构 2.1.4 数据仓库的数据模型 2.2 数据仓库的设计步骤 2.2.1 概念模型设计 2.2.2 逻辑模型设计 2.2.3 物理模型设计 2.2.4 数据仓库的生成 2.2.5 数据仓库的运行与维护 2.3 联机分析处理 2.3.1 联机分析处理的定义 2.3.2 联机分析处理的多维数据存储 2.3.3 联机分析处理的分类 小结 思考题 第3章 数据预处理 3.1 数据预处理概述 3.1.1 数据预处理的目的 3.1.2 数据预处理的方法 3.2 数据清洗 3.2.1 数据清洗的方法和步骤 3.2.2 缺失值的识别与处理技巧 3.2.3 异常值的判断、检验与处理 3.3 数据集成 3.3.1 数据集成常见方法 3.3.2 数据冲突的检测和解决 3.3.3 处理数据集成中的冗余数据 3.3.4 相关分析 3.4 数据变换 3.4.1 数据变换过程中的离散化 3.4.2 数据变换的规范化方法 3.5 数据规约 3.5.1 数据规约的定义与目的 3.5.2 常用的数据规约策略 小结 思考题 第4章 关联规则挖掘 4.1 关联规则挖掘概述 4.1.1 关联规则的分类及应用 4.1.2 关联规则挖掘示例 4.2 Apriori算法 4.2.1 Apriori算法的定义与特点 4.2.2 Apriori算法的应用 4.2.3 Apriori算法分析与改进 4.3 FP-Growth算法 4.3.1 FP-Growth算法的基本思想 4.3.2 FP-Growth算法的特点及改进 小结 思考题 第5章 聚类分析 5.1 聚类分析概述 5.1.1 什么是聚类分析 5.1.2 聚类中的相异度计算 5.2 基于划分的聚类 5.2.1 K-means算法 5.2.2 K-medoids算法 5.2.3 K-medoids算法中的PAM算法示例 5.3 基于层次的聚类 5.3.1 层次聚类的基本思想 5.3.2 AGNES算法 5.3.3 DIANA算法 5.3.4 Birch层次聚类算法 5.4 基于密度的聚类 5.4.1 DBSCAN算法的流程 5.4.2 DBSCAN算法的性能分析 5.4.3 OPTICS密度聚类算法 5.5 基于模型的聚类算法 5.5.1 高斯混合模型的原理 5.5.2 EM算法的应用 小结 思考题 第6章 回归分析 6.1 回归分析概述 6.2 简单线性回归分析 6.2.1 简单线性回归分析的定义 6.2.2 简单线性回归分析的应用 6.3 多元回归分析 6.3.1 多元回归分析的定义 6.3.2 多元回归分析的步骤 6.3.3 多元回归分析的应用 6.4 岭回归分析 6.4.1 岭回归分析的原理 6.4.2 岭回归分析在数据挖掘领域的应用 6.5 逻辑回归分析 6.5.1 逻辑回归分析的原理 6.5.2 逻辑回归模型的建立与参数估计 6.5.3 逻辑回归分析的优化和改进 6.5.4 逻辑回归分析在数据挖掘领域的发展趋势 小结 思考题 第7章 决策树分析 7.1 决策树分析的有关概念 7.1.1 信息论的基本原理 7.1.2 决策树分析流程 7.1.3 决策树分类算法 7.2 ID3算法 7.2.1 ID3算法介绍 7.2.2 ID3算法的实例分析 7.2.3 ID3算法的特点及应用 7.3C4.5 算法 7.3.1C4.5 算法介绍 7.3.2C4.5 算法的特点及应用 7.4 CART算法 7.4.1 CART算法的原理与特点 7.4.2 CART算法的应用 小结 思考题 第8章 SPSS数据挖掘基础 8.1 SPSS的发展 8.2 SPSS应用入门 8.3 SPSS界面介绍 8.3.1 SPSS的窗口 8.3.2 SPSS的菜单 8.4 建立SPSS文件 8.4.1 SPSS文件类型 8.4.2 数据录入 8.4.3 文件的保存与导出 8.5 SPSS数据的变量属性定义 8.5.1 变量名称和类型 8.5.2 变量宽度和小数 8.5.3 标签和值 8.5.4 变量缺失值 8.5.5 变量显示列、对齐方式 8.5.6 变量测量方式和变量角色 8.6 SPSS数据管理 8.6.1 插入或删除个案 8.6.2 插入或删除变量 8.6.3 数据排序 8.6.4 数据的行列转置 8.6.5 选取个案 8.6.6 数据合并 8.6.7 拆分数据文件 8.7 SPSS数据转换 8.7.1 计算产生变量 8.7.2 对个案内的值计数 8.7.3 重新编码 小结 思考题 第9章 SPSS数据挖掘统计分析方法 9.1 基本描述统计 9.1.1 频数分析 9.1.2 描述分析 9.1.3 探索分析 |