网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 数据挖掘原理(第2版Springer精选翻译图书)
分类
作者 (英)马科斯·布拉默
出版社 哈尔滨工业大学出版社
下载
简介
内容推荐
Principles of Data Mining是数据挖掘领域具有重要影响的国外著名教材之一,原为斯普林格出版社计算机科学本科生系列教材中的一本。在读者的期待中,本书的译本得以出版。从数据集本身特性的探讨,到分类、规则挖掘及聚类等基本方法的阐明,再到数据科学的工程场景的融合,本书可帮助数据挖掘学习者形成清晰的学科观。
本书具备如下特色:
本书并未依赖数学工具和语言,而是通过对案例的精细剖析向读者传递了具有相当技术深度的内容,是一本对初学者友好并且技术足够有深度的专业基础书籍。
本书侧重于数据挖掘技术领域通用原理的讲解,作者对数据挖掘中的分类、关联规则挖掘及聚类等基本问题中的共性原则基于案例进行了深入分析,对于数据技术初学者来说,这部分内容的理解比流行技术介绍有更重要的意义和价值。
总之,本书是一部历久弥新的优秀数据挖掘教材,既适合数据挖掘初学者探索数据挖掘的趣味,也适合数据挖掘从业者补遗学科知识体系、深入理解学科知识的内涵和外延。
目录
第1章 数据挖掘介绍
1.1 数据爆炸
1.2 知识发现
1.3 数据挖掘的应用
1.4 标记和未标记数据
1.5 监督学习:分类
1.6 监督学习:数值预测
1.7 非监督学习:关联规则
1.8 非监督学习:聚类
第2章 数据挖掘中的数据
2.1 标准制定
2.2 变量类型
2.3 数据准备
2.4 缺失值
2.5 减少属性数量
2.6 数据集的UCI资源库
2.7 本章总结
2.8 自测题
参考文献
第3章 分类简介:朴素贝叶斯与最近邻算法
3.1 分类定义
3.2 朴素贝叶斯分类器
3.3 最近邻分类
3.4 迫切和惰性学习
3.5 本章总结
3.6 自测题
第4章 使用决策树进行分类
4.1 决策规则和决策树
4.2 TDIDT算法
4.3 推理的类型
4.4 本章总结
4.5 自测题
参考文献
第5章 决策树归纳:使用熵进行属性选择
5.1 属性选择:一个试验
5.2 替代决策树
5.3 选择要拆分的属性:使用熵
5.4 本章总结
5.5 自测题
第6章 决策树归纳:使用频率表进行属性选择
6.1 在实践中计算熵
6.2 其他属性选择标准:基尼指数
6.3 X2属性选择标准
6.4 归纳偏置
6.5 使用增益比进行属性选择
6.6 不同属性选择标准生成的规则数量
6.7 缺少分支
6.8 本章总结
6.9 自测题
参考文献
第7章 评估分类器的预测精度
7.1 引言
7.2 方法一:训练集和测试集
7.3 方法二:k倍交叉验证
7.4 方法三:N倍交叉验证
7.5 实验结果一
7.6 实验结果二:带有缺失值的数据集
7.7 混淆矩阵
7.8 本章总结
7.9 自测题
参考文献
第8章 连续型属性
8.1 引言
8.2 局部与全局离散化
8.3 将局部离散化添加到TDIDT
8.4 使用ChiMerge算法进行全局离散化
8.5 全局和局部离散化树归纳法对比分析
8.6 本章总结
8.7 自测题
参考文献
第9章 避免决策树的过度拟合
9.1 处理训练集中的冲突
9.2 更多关于规则过拟合的讨论
9.3 预剪枝决策树
9.4 后剪枝决策树
9.5 本章总结
9.6 自测题
参考文献
第10章 更多关于熵的讨论
10.1 引言
10.2 利用位编码信息
10.3 在M个值中进行区分(M不是2的幂)
10.4 对不等概率的数值进行编码
10.5 训练集的熵
10.6 信息增益必须是正值或零值
10.7 利用信息增益减少分类任务的特征
10.8 本章总结
10.9 自测题
参考文献
第11章 采用模块化分类规则
11.1 规则后剪枝
11.2 冲突消解
11.3 决策树的问题
11.4 Prism算法
11.5 本章总结
11.6 自测题
参考文献
第12章 评估分类器的性能
12.1 真假阳性与真假阴性
12.2 性能指标
12.3 真假阳性率与预测精度
12.4 ROC图
12.5 ROC曲线
12.6 寻找最佳分类器
12.7 本章总结
12.8 自测题
第13章 大规模数据集处理
13.1 引言
13.2 数据的多处理器分布式处理
13.3 情景学习:PMCRI
13.4 评估分布式系统PMCRI的有效性
13.5 逐步修改分类器
13.6 本章总结
13.7 自测题
参考文献
第14章 集成分类
14.1 引言
14.2 评估分类器性能
14.3 为每个分类器选择不同的训练集
14.4 为每个分类器选择不同的属性集
14.5 合并分类:替代投票系统
14.6 并行集成分类器
14.7 本章总结
14.8 自测题
参考文献
第15章 分类器性能比较
15.1 引言
15.2 成对t检验
15.3 选择数据集进行比较评估
15.4 采样
15.5 “没有显著差异”的结果有多糟糕
15.6 本章总结
15.7 自测题
参考文献
第16章 关联规则挖掘一
16.1 引言
16.2 规则兴趣度量
16.3 关联规则挖掘任务
16.4 找到最好的Ⅳ条规则
16.5 本章总结
16.6 自测题
参考文献
第17章 关联规则挖掘二
17.1 引言
17.2 交易和商品集
17.3 对商品集的支持
17.4 关联规则
17.5 生成关联规则
17.6 Apriori算法
17.7 生成支持商品集:一个例子
17.8 从支持商品集中生成规则
17.9 规则兴趣度量:提升度和杠杆率
17.10 本章总结
17.11 自测题
参考文献
第18章 关联规则挖掘三:频繁模式树
18.1 引言:FP—gmwth
18.2 建立FP树
18.3 从FP树查找频繁商品集
18.4 本章总结
18.5 自测题
参考文献
第19章 聚类
19.1 引言
19.2 k-means聚类
19.3 合成聚类
19.4 本章总结
19.5 自测题
第20章 文本挖掘
20.1 多重分类
20.2 文本文件的表示方法
20.3 词干和停止词
20.4 使用信息增益进行特征缩减
20.5 文本文档表示:构造向量空间模型
20.6 权重归一化
20.7 两个向量间距离测量
20.8 文本分类器性能测量
20.9 超文本分类
20.10 本章总结
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/23 9:28:36