![]()
内容推荐 本书讲解了数据分析与数据挖掘的理论和方法,包括描述性统计、假设检验、方差分析、回归分析、关联规则、决策树、贝叶斯模型、判别分析、支持向量机、神经网络、聚类分析、离群点分析等,同时配有应用举例。大数据分析、人工智能与互联网的发展为该领域的研究提出了新的需求,本书在阐述理论方法的同时,也注重实践,更注重知识体系结构。书中的理论和技术既能作为科研的基础,也能直接用来解决实际问题。 本书可作为相关专业高年级本科生和研究生的教学用书,也可作为数据分析与数据挖掘研究人员的参考用书。 目录 第1章 数据分析与数据挖掘基础 1.1 数据分析与数据挖掘需求 1.1.1 数据分析与数据挖掘 1.1.2 大数据处理需求 1.1.3 数据分析误区与隐私问题 1.2 数据分析与数据挖掘的工作过程 1.2.1 数据分析的主要工作过程 1.2.2 数据收集 1.2.3 数据展示 1.3 数据的组织和数据的类型 1.3.1 数据的一般组织形式 1.3.2 数据类型 1.3.3 分类数据的编码 1.4 数据的常用描述性统计量 1.4.1 数据的中心趋势 1.4.2 数据的离散程度 1.4.3 数据的形态统计量 1.5 数据的基本描述性统计分析 1.5.1 数据的描述性统计 1.5.2 五数概括与盒图 1.5.3 数据的描述性统计图 1.6 本章小结 本章概念与关键词 练习与思考 第2章 数据抽样与推断检验 2.1 随机变量概率分布 2.1.1 概率分布 2.1.2 正态分布 2.1.3 二项分布与泊松分布 2.1.4 几何分布与超几何分布 2.2 抽样统计分析 2.2.1 抽样的相关概念 2.2.2 概率抽样的典型方法 2.2.3 非随机抽样的典型方法 2.3 基本抽样分布 2.3.1 经验分布、理论分布与抽样分布 2.3.2 三大抽样分布 2.3.3 小概率事件 2.4 常用的抽样分布与区间估计 2.4.1 常用的统计量抽样分布 2.4.2 置信区间与区间估计 2.5 常用的参数检验 2.5.1 假设检验一般过程 2.5.2 常用的参数检验统计量 2.6 常用的单样本非参数检验 2.6.1 卡方检验 2.6.2 二项分布检验 2.6.3 固定参数的超几何分布检验 2.6.4 游程检验 2.6.5 单样本K-S检验 2.7 本章小结 本章概念与关键词 练习与思考 第3章 可视化图与分组检验 3.1 数据的常用可视化图分析 3.1.1 数据的常用可视化图 3.1.2 基于图的可视化观测一般过程 3.2 均值比较和t检验 3.2.1 分组统计 3.2.2 数据标准化与Z-Score 3.2.3 单样本t检验 3.2.4 两立样本t检验 3.2.5 两配对样本t检验 3.3 方差齐性检验 3.3.1 Levene方差齐性检验 3.3.2 基于F检验的方差齐性检验 3.3.3 Brown-Forsythe方差齐性检验 3.3.4 Bartlett's方差齐性检验 3.4 两立样本的非参数检验 3.4.1 Mann-Whitney U检验 …… 第4章 方差分析与相关性分析 第5章 数据的预处理与距离分析 第6章 回归分析 第7章 空间降维技术 第8章 关联规则与点对相关性 第9章 决策树 第10章 贝叶斯分类 第11章 特征空间与判别分析 第12章 感知机与支持向量机 第13章 人工神经网络 第14章 集成学习 第15章 聚类分析与离群点分析 附录A Mann-WhitneyU检验的临界表 附录B Wilcoxonsigned-rank检验按符号秩和的临界表 附录C Wilcoxonsigned-rank检验按min(正号秩,负号秩)的临界表 附录D q分布(Studentized range distribution)的临界表 附录E Dunnett双尾检验的临界表 附录F 相关系数R和判定系数R2的临界表 附录G 鸢尾花数据集 参考文献 |