网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 数据挖掘方法与应用
分类
作者 徐雪琪编
出版社 清华大学出版社
下载
简介
内容推荐
本书以应用为导向介绍数据挖掘的相关工具、理论和方法,包括数据挖掘概述、数据挖掘工具、数据与数据平台、数据预处理、关联分析、决策树、贝叶斯分类和神经网络。通过循序渐进地讲解数据挖掘可使用的工具、数据存储及分析环境、原始数据可能存在的问题及相应的预处理方法、数据挖掘经典算法等相关知识,使读者对数据挖掘有整体的认识和了解。此外,本书以解决问题为目的,结合实例阐述了使用IBM SPSS Modeler和R软件进行数据挖掘的方法与步骤,便于读者更好地理解和掌握。本书可作为统计学、大数据等相关专业高年级本科生及硕士研究生数据挖掘课程的教材,也可作为其他数据挖掘爱好者的参考用书。
目录
章数据挖掘概述1
1.1数据挖掘的产生与发展1
1.1.1数据挖掘概念的提出2
1.1.2数据挖掘系统的发展3
1.1.3当前热点和未来趋势5
1.2数据挖掘过程10
1.2.1Fayyad过程模型10
1.2.2CRISP-DM过程模型11
1.3数据挖掘功能与使用技术21
1.3.1数据挖掘功能21
1.3.2数据挖掘使用技术22
1.4数据挖掘应用26
1.4.1金融领域的数据挖掘26
1.4.2电信领域的数据挖掘26
1.4.3零售与电子商务领域的数据挖掘27
1.4.4政府政务领域的数据挖掘27
1.4.5医疗领域的数据挖掘28
1.4.6科学领域的数据挖掘28
1.5练习与拓展28
第2章数据挖掘工具30
2.1Weka30
2.1.1Weka简述30
2.1.2Weka运行界面31
2.2IBMSPSSModeler34
2.2.1IBMSPSSModeler简述34
2.2.2IBMSPSSModeler主界面及功能35
2.3R语言41
2.3.1R语言简述41
2.3.2RStudio42
2.3.3R语言与数据挖掘42
2.4Python语言45
2.4.1Python语言简述45
2.4.2Python与数据分析46
2.4.3Anaconda46
2.5练习与拓展50
第3章数据与数据平台51
3.1数据类型51
3.1.1数据形态与数据类型51
3.1.2数据环境与数据类型54
3.2关系型数据库55
3.2.1关系型数据库概述55
3.2.2关系型数据库管理系统56
3.3NoSQL数据库57
3.3.1键值数据库57
3.3.2文档数据库58
3.3.3列族数据库60
3.3.4图数据库61
3.4数据仓库与大数据平台63
3.4.1数据仓库63
3.4.2大数据平台68
3.5练习与拓展74
第4章数据预处理75
4.1数据预处理概述75
4.1.1原始数据中存在的问题75
4.1.2数据预处理的主要任务77
4.2数据清洗77
4.2.1缺失数据处理77
4.2.2异常数据处理78
4.3数据集成80
4.3.1模式匹配及数值一致化80
4.3.2删除冗余数据81
4.4数据变换82
4.4.1定性数据数值化82
4.4.2定量数据离散化和规范化83
4.4.3不平衡数据处理84
4.5数据归约85
4.5.1属性的归约85
4.5.2记录的归约87
4.5.3数值的归约88
4.6练习与拓展89
第5章关联分析90
5.1关联分析概述90
5.1.1关联分析基本概念91
5.1.2关联规则挖掘的基本过程93
5.2Apriori算法94
5.2.1Apriori性质94
5.2.2Apriori算法的频繁项集产生95
5.3强关联规则的悖论99
5.3.1强关联规则不一定是有趣的规则99
5.3.2基于提升度过滤无趣的强关联规则100
5.3.3基于支持度、置信度及提升度的关联规则发现100
5.4基于IBMSPSSModeler的应用103
5.4.1事实表数据的应用示例103
5.4.2事务表数据的应用示例113
5.5基于R语言的应用123
5.5.1数据初探123
5.5.2可视化交易数据125
5.5.3挖掘关联规则127
5.5.4可视化关联规则130
5.6练习与拓展134
第6章决策树136
6.1决策树概述136
6.1.1决策树分析相关概念137
6.1.2决策树分析核心问题138
6.2ID3算法138
6.2.1信息论的基本概念138
6.2.2ID3算法基本原理139
6.2.3使用ID3算法建立决策树141
6.3C5.0算法143
6.3.1C5.0算法的决策树生长144
6.3.2C5.0算法的决策树修剪149
6.4基于IBMSPSSModeler的应用151
6.4.1数据读取与审核152
6.4.2探索性分析153
6.4.3数据预处理158
6.4.4决策树模型构建与评估:基于C5.0算法163
6.4.5预测结果170
6.5基于R语言的应用171
6.5.1数据探索172
6.5.2数据分区177
6.5.3模型训练与评估178
6.5.4使用boosting和代价矩阵调整模型181
6.6练习与拓展184
第7章贝叶斯分类185
7.1贝叶斯分类概述185
7.1.1贝叶斯定理186
7.1.2贝叶斯信念网络186
7.2朴素贝叶斯分类188
7.2.1朴素贝叶斯分类原理188
7.2.2朴素贝叶斯分类计算示例191
7.2.3零概率问题:拉普拉斯平滑193
7.3TAN贝叶斯分类194
7.3.1TAN贝叶斯网络结构194
7.3.2TAN贝叶斯分类过程195
7.4基于IBMSPSSModeler的应用196
7.4.1数据读取与审核198
7.4.2探索性分析199
7.4.3数据预处理208
7.4.4TAN贝叶斯分类模型构建与评估210
7.5基于R语言的应用214
7.5.1数据探索214
7.5.2文本数据预处理215
7.5.3划分数据集219
7.5.4词云分析221
7.5.5模型训练与评估223
7.6练习与拓展225
第8章神经网络226
8.1神经网络概述226
8.1.1生物神经元与人工神经元226
8.1.2激活函数227
8.1.3神经网络的拓扑结构230
8.2BP神经网络232
8.2.1BP神经网络的学习过程232
8.2.2BP算法描述237
8.2.3前馈神经网络计算示例238
8.3卷积神经网络240
8.3.1卷积层240
8.3.2激活层243
8.3.3池化层244
8.3.4全连接层244
8.4基于IBMSPSSModeler的应用245
8.4.1数据读取246
8.4.2“数据审核”节点预处理247
8.4.3探索性分析250
8.4.4分区与平衡251
8.4.5模型构建与评价252
8.5基于R语言的应用260
8.5.1数据初探260
8.5.2数据转换与分区263
8.5.3模型构建与评价263
8.6练习与拓展268
参考文献270
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/1/19 12:59:59