数据挖掘基础教程(附光盘)/计算机科学丛书(印度)西蒙机械工业出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

出版者的话

译者序

前言

第1章数据挖掘

1.1 引言

1.1.1 数据挖掘与知识发现

1.1.2 数据挖掘与数据分析

1.1.3 数据挖掘与统计学

1.1.4 数据挖掘与机器学习

1.2 数据挖掘——成功的例子

1.3 数据挖掘研究发展的主要原因

1.4 当前研究成果

1.5 图形模型和层次概率表示

1.6 新的应用

1.7 影响数据挖掘的趋势

1.8 研究挑战

1.9 实验平台和基础设施

参考文献

第2章从商务角度看数据挖掘

2.1 引言

2.2 从数据挖掘工具到解决方案

2.3 数据挖掘系统的演变

2.4 知识发现过程

2.5 数据挖掘支撑技术概述

2.5.1 数据挖掘：验证与发现

2.5.2 决策支持系统

2.5.3 OLAP

2.5.4 桌面DSS

2.5.5 数据仓库

2.5.6 数据挖掘过程

2.6 数据挖掘技术

参考文献

第3章数据挖掘算法的数据类型、输入和输出

3.1 引言

3.2 实例和特征

3.3 特征(数据)的不同类型

3.4 概念学习与概念描述

3.5 数据挖掘的输出——知识表示

3.5.1 分类学习算法的知识输出

3.5.2 聚类学习算法的输出

3.5.3 关联规则的输出

3.5.4 用于数值预测的树的输出

3.5.5 基于实例的学习和知识表示

参考文献

第4章决策树——分类和回归树

4.1 引言

4.2 构造分类树

4.2.1 用于标称属性的ID3算法

4.2.2 信息论和信息熵

4.2.3 构造树

4.2.4 高分支属性

4.2.5 从ID3到C4.5

4.2.6 形象化地理解ID3和C4.5算法

4.3 CHAID

4.3.1 CHAID的数学工具

4.3.2 CHAID变量的类型

4.3.3 CHAID算法

4.3.4 CHAID算法描述

4.3.5 将CHAID用于气象数据

4.3.6 单调变量的预测子级别合并

4.4 CART(分类和回归树)

4.4.1 CART使用的不纯性度量

4.4.2 Gini指数

4.4.3 使用Gini指数——一个例子

4.4.4 双化指数

4.4.5 有序双化

4.4.6 CAR了分析的步骤

4.5 回归树

4.5.1 回归树的一个例子

4.5.2 基于树的回归

4.5.3 最小二乘方回归树

4.5.4 Ls回归树的有效生长

4.5.5 连续变量上的划分

4.5.6 离散变量上的划分

4.5.7 模型树

4.6 具有未知类值数据的类预测的一般问题

4.7 剪枝导论

4.8 模型评估

4.8.1 交叉确认：保持方法

4.8.2 模型比较

4.8.3 代价敏感的学习

习题

参考文献

第5章数据挖掘的预处理和后处理

5.1 引言

5.2 数据预处理的步骤

5.3 离散化

5.3.1 人工方法

5.3.2 分箱

5.3.3 基于熵的离散化

5.3.4 找出分割点的其他简单方法

5.4 特征提取、选择和构造

5.4.1 特征提取

5.4.2 特征选择

5.4.3 特征构造

5.5 缺失数据及其处理方法和技术

5.5.1 什么是缺失数据

5.5.2 缺失数据的主要原因

5.5.3 缺失数据的机制

5.5.4 缺失数据的机制——一个人工例子

5.6 在决策树归纳中处理缺失数据的例子

5.7 后处理

参考文献

第6章数据集

6.1 引言

6.2 隐形眼镜

6.3 鸢尾属植物数据库

6.4 乳腺癌数据库

6.5 工资数据库

6.6 信用卡数据库

6.7 住宅数据库

6.8 1985年汽车进口数据库

6.9 徽章问题

6.9.1 问题描述

6.9.2 部分数据

第7章关联规则挖掘

7.1 引言

7.2 事务数据库中关联规则的自动发现

7.3 Apiiori算法

7.4 缺点

习题

参考文献

第8章用开源和商业软件进行机器学习

8.1 用Weka进行机器学习

8.1.1 开始

8.1.2 装人数据

8.1.3 选择或过滤属性

8.1.4 离散化

8.1.5 关联规则挖掘

8.1.6 分类

8.1.7 聚类

8.2 XLMINER

参考文献

第9章分类和回归算法

9.1 引言

9.2 朴素贝叶斯

9.2.1 朴素贝叶斯的零频率问题

9.2.2 缺失值和数值属性

9.3 多元回归分析

9.3.1 什么是回归分析

9.3.2 简单和多元回归分析

9.3.3 在市场营销中的应用

9.3.4 方法

9.3.5 使用Excel进行多元回归分析

9.3.6 输人数据

9.3.7 回归输出

9.4 逻辑斯谛回归

9.5 k-最近邻分类

9.5.1 k-近邻预测

9.5.2 k-NN算法的缺点

9.6 GMDH

9.6.1 引言

9.6.2 数据处理群组方法的背景

9.6.3 构建决策规则

9.6.4 实验结果

9.6.5 讨论和总结

9.7 进化计算和遗传算法

9.7.1 进化理论

9.7.2 遗传算法

9.7.3 使用遗传算法进行机器学习

习题

参考文献

第10章支持向量机

10.1 引言

10.2 线性支持向量机的基本思想

10.3 软边缘SVM：线性核

10.3.1 线性SVM的线性规划公式表示

10.3.2 有训练误差的SVM：非线性核

10.4 邻近支持向量机

10.5 生成数据集

10.5.1 螺旋数据生成器

10.5.2 棋盘格数据集

10.5.3 多元正态分布数据生成器

10.6 问题及解答

习题

参考文献

第11章聚类分析

11.1 引言

11.1.1 相似性及其度量

11.1.2 聚类的基本类型

11.2 划分聚类

11.3 k-中心点

11.4 现代聚类方法

11.5 BIRCH

11.6 DBSCAN

11.6.1 DBSCAN算法的概念

11.6.2 DBSCAN的基本概念和算法

11.6.3 算法

11.6.4 DBSCAN算法的优点

11.7 OPTICS

11.7.1 引言

11.7.2 OPTICS算法的动机

11.7.3 OPTICS采用的概念

11.7.4 OPTICS算法

11.7.5 可达图

11.7.6 优点

11.7.7 缺点

11.8 基于图划分的聚类

11.8.1 加权图划分

11.8.2 平衡图划分——基本原则

11.8.3 κ路划分

11.9 CHAMELEON：两阶段聚类算法

11.9.1 数据建模

11.9.2 簇相似性建模

11.9.3 CHAMELEON的两个阶段

11.9.4 用例子说明CHAMELEON算法

11.10 COBWEB概念聚类算法

11.10.1 COBWEB算法

11.10.2 COBWEB：一个简单例子

11.11 GCLUTO：图形化聚类工具箱

11.11.1 概述

11.11.2 GCLUTO中的可用选项

11.11.3 使用GCLUTO进行文本

挖掘

习题

参考文献

第12章多维数据可视化

12.1 引言

12.2 多维可视化的图表表示

12.2.1 kiviat图

12.2.2 平行坐标系

12.2.3 3D散点图

12.2.4 3D曲线图

12.2.5 体积透视图

12.2.6 房图

12.2.7 Chemoff脸图

12.3 可视化数据挖掘

参考文献

附录A SVM公式：完全可分的线性分类器

附录B 图划分的矩阵形式

书名	数据挖掘基础教程(附光盘)/计算机科学丛书
分类
作者	(印度)西蒙
出版社	机械工业出版社
下载
简介	编辑推荐数据挖掘是一个新兴的多学科交叉领域，它基于人工智能、机器学习、模式识别、统计学、数据库、可视化等技术，能够从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息，目前已广泛应用于科学、工程、商业、医学等领域。本书旨在向读者介绍数据挖掘方法和算法，涵盖数据挖掘中数据的预处理、分类、预测、聚类、关联、支持向量机、多维数据可视化等内容，以及用于这些数据挖掘问题的典型算法。使读者能够应用这些方法解决现实世界中的问题。本书精心选择了在数据挖掘领域中广泛使用的大部分方法，并辅以简单的例子，因而是学习数据挖掘的理想教材。内容推荐本书全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。本书讲解深入浅出，并辅以大量实例，随书光盘提供了大量数据集以及两种广泛使用的数据挖掘软件——Weka和ExcelMiner，便于读者理解数据挖掘知识。本书适合作为高等院校计算机及相关专业数据挖掘课程的教材，也可供广大技术人员参考。目录出版者的话译者序前言第1章数据挖掘 1.1 引言 1.1.1 数据挖掘与知识发现 1.1.2 数据挖掘与数据分析 1.1.3 数据挖掘与统计学 1.1.4 数据挖掘与机器学习 1.2 数据挖掘——成功的例子 1.3 数据挖掘研究发展的主要原因 1.4 当前研究成果 1.5 图形模型和层次概率表示 1.6 新的应用 1.7 影响数据挖掘的趋势 1.8 研究挑战 1.9 实验平台和基础设施参考文献第2章从商务角度看数据挖掘 2.1 引言 2.2 从数据挖掘工具到解决方案 2.3 数据挖掘系统的演变 2.4 知识发现过程 2.5 数据挖掘支撑技术概述 2.5.1 数据挖掘：验证与发现 2.5.2 决策支持系统 2.5.3 OLAP 2.5.4 桌面DSS 2.5.5 数据仓库 2.5.6 数据挖掘过程 2.6 数据挖掘技术参考文献第3章数据挖掘算法的数据类型、输入和输出 3.1 引言 3.2 实例和特征 3.3 特征(数据)的不同类型 3.4 概念学习与概念描述 3.5 数据挖掘的输出——知识表示 3.5.1 分类学习算法的知识输出 3.5.2 聚类学习算法的输出 3.5.3 关联规则的输出 3.5.4 用于数值预测的树的输出 3.5.5 基于实例的学习和知识表示参考文献第4章决策树——分类和回归树 4.1 引言 4.2 构造分类树 4.2.1 用于标称属性的ID3算法 4.2.2 信息论和信息熵 4.2.3 构造树 4.2.4 高分支属性 4.2.5 从ID3到C4.5 4.2.6 形象化地理解ID3和C4.5算法 4.3 CHAID 4.3.1 CHAID的数学工具 4.3.2 CHAID变量的类型 4.3.3 CHAID算法 4.3.4 CHAID算法描述 4.3.5 将CHAID用于气象数据 4.3.6 单调变量的预测子级别合并 4.4 CART(分类和回归树) 4.4.1 CART使用的不纯性度量 4.4.2 Gini指数 4.4.3 使用Gini指数——一个例子 4.4.4 双化指数 4.4.5 有序双化 4.4.6 CAR了分析的步骤 4.5 回归树 4.5.1 回归树的一个例子 4.5.2 基于树的回归 4.5.3 最小二乘方回归树 4.5.4 Ls回归树的有效生长 4.5.5 连续变量上的划分 4.5.6 离散变量上的划分 4.5.7 模型树 4.6 具有未知类值数据的类预测的一般问题 4.7 剪枝导论 4.8 模型评估 4.8.1 交叉确认：保持方法 4.8.2 模型比较 4.8.3 代价敏感的学习习题参考文献第5章数据挖掘的预处理和后处理 5.1 引言 5.2 数据预处理的步骤 5.3 离散化 5.3.1 人工方法 5.3.2 分箱 5.3.3 基于熵的离散化 5.3.4 找出分割点的其他简单方法 5.4 特征提取、选择和构造 5.4.1 特征提取 5.4.2 特征选择 5.4.3 特征构造 5.5 缺失数据及其处理方法和技术 5.5.1 什么是缺失数据 5.5.2 缺失数据的主要原因 5.5.3 缺失数据的机制 5.5.4 缺失数据的机制——一个人工例子 5.6 在决策树归纳中处理缺失数据的例子 5.7 后处理参考文献第6章数据集 6.1 引言 6.2 隐形眼镜 6.3 鸢尾属植物数据库 6.4 乳腺癌数据库 6.5 工资数据库 6.6 信用卡数据库 6.7 住宅数据库 6.8 1985年汽车进口数据库 6.9 徽章问题 6.9.1 问题描述 6.9.2 部分数据第7章关联规则挖掘 7.1 引言 7.2 事务数据库中关联规则的自动发现 7.3 Apiiori算法 7.4 缺点习题参考文献第8章用开源和商业软件进行机器学习 8.1 用Weka进行机器学习 8.1.1 开始 8.1.2 装人数据 8.1.3 选择或过滤属性 8.1.4 离散化 8.1.5 关联规则挖掘 8.1.6 分类 8.1.7 聚类 8.2 XLMINER 参考文献第9章分类和回归算法 9.1 引言 9.2 朴素贝叶斯 9.2.1 朴素贝叶斯的零频率问题 9.2.2 缺失值和数值属性 9.3 多元回归分析 9.3.1 什么是回归分析 9.3.2 简单和多元回归分析 9.3.3 在市场营销中的应用 9.3.4 方法 9.3.5 使用Excel进行多元回归分析 9.3.6 输人数据 9.3.7 回归输出 9.4 逻辑斯谛回归 9.5 k-最近邻分类 9.5.1 k-近邻预测 9.5.2 k-NN算法的缺点 9.6 GMDH 9.6.1 引言 9.6.2 数据处理群组方法的背景 9.6.3 构建决策规则 9.6.4 实验结果 9.6.5 讨论和总结 9.7 进化计算和遗传算法 9.7.1 进化理论 9.7.2 遗传算法 9.7.3 使用遗传算法进行机器学习习题参考文献第10章支持向量机 10.1 引言 10.2 线性支持向量机的基本思想 10.3 软边缘SVM：线性核 10.3.1 线性SVM的线性规划公式表示 10.3.2 有训练误差的SVM：非线性核 10.4 邻近支持向量机 10.5 生成数据集 10.5.1 螺旋数据生成器 10.5.2 棋盘格数据集 10.5.3 多元正态分布数据生成器 10.6 问题及解答习题参考文献第11章聚类分析 11.1 引言 11.1.1 相似性及其度量 11.1.2 聚类的基本类型 11.2 划分聚类 11.3 k-中心点 11.4 现代聚类方法 11.5 BIRCH 11.6 DBSCAN 11.6.1 DBSCAN算法的概念 11.6.2 DBSCAN的基本概念和算法 11.6.3 算法 11.6.4 DBSCAN算法的优点 11.7 OPTICS 11.7.1 引言 11.7.2 OPTICS算法的动机 11.7.3 OPTICS采用的概念 11.7.4 OPTICS算法 11.7.5 可达图 11.7.6 优点 11.7.7 缺点 11.8 基于图划分的聚类 11.8.1 加权图划分 11.8.2 平衡图划分——基本原则 11.8.3 κ路划分 11.9 CHAMELEON：两阶段聚类算法 11.9.1 数据建模 11.9.2 簇相似性建模 11.9.3 CHAMELEON的两个阶段 11.9.4 用例子说明CHAMELEON算法 11.10 COBWEB概念聚类算法 11.10.1 COBWEB算法 11.10.2 COBWEB：一个简单例子 11.11 GCLUTO：图形化聚类工具箱 11.11.1 概述 11.11.2 GCLUTO中的可用选项 11.11.3 使用GCLUTO进行文本挖掘习题参考文献第12章多维数据可视化 12.1 引言 12.2 多维可视化的图表表示 12.2.1 kiviat图 12.2.2 平行坐标系 12.2.3 3D散点图 12.2.4 3D曲线图 12.2.5 体积透视图 12.2.6 房图 12.2.7 Chemoff脸图 12.3 可视化数据挖掘参考文献附录A SVM公式：完全可分的线性分类器附录B 图划分的矩阵形式
随便看	万事楼也说沧海缠情公主的战争夏天 BL遇上我爱情的天窗上，还是被上，这是个问题！纯真年代第三基因冷玉天涯闺中密友无眠的心塞外沉沙爱情片断一个人小小的心事永远的TOUCH 撒旦的赌约命运星之泣盼暮月影迷蝶宁语红楼之鸳鸯戒我终于遗失了。。。。浪漫双面小精灵鑫胜汇商城好买——新人专享50元优惠券道道生活新鲜惠玩转大湘西本邦淘全民找车试客购物富佬哥商城燕都教育俺家小院游戏中心 V1.1.1.1 帝国时代3中文补丁 V1.6 CraftMineFun(我的世界服务器启动器) V1.7.2018.4.216 绿色版饥荒帝王权杖MOD v3.27 七日杀快捷商人MOD v1.0 赛博朋克2077光学迷彩错误修复MOD v2.67 Game Backup Monitor(游戏云备份工具)X64 V1.1.1 英文版雷电手游助手 V1.0.19 LOL伴侣 V1.0.0.33 小苹果cf活动助手 V1.27 绿色版 calypso calyx camaraderie camber cambium Cambodia Cambodian Cambrian camcorder came [BT下载][犯罪心理：演变.第十八季][第04集][WEB-MKV/1.61G][简繁英字幕][1080P][Disney+][流媒体][DeePTV] [BT下载][犯罪心理：演变.第十八季][第04集][WEB-MKV/6.37G][简繁英字幕][4K-2160P][杜比视界版本][H265][D [BT下载][犯罪心理：演变.第十八季][第04集][WEB-MKV/4.69G][简繁英字幕][4K-2160P][HDR版本][H265][Disney [BT下载][男女之间的友情存在吗？（不，不存在!!）][第09集][WEB-MKV/0.25G][简繁英字幕][1080P][流媒体][DeePTV] [BT下载][男女之间的友情存在吗？（不，不存在!!）][第09集][WEB-MP4/0.30G][中文字幕][1080P][流媒体][DeePTV] [BT下载][男女之间的友情存在吗？（不，不存在!!）][第09集][WEB-MKV/1.34G][简繁英字幕][1080P][流媒体][DeePTV] [BT下载][男女之间的友情存在吗？（不，不存在!!）][第09集][WEB-MKV/1.61G][中文字幕][1080P][流媒体][DeePTV] [BT下载][悬案解码][全9集][WEB-MKV/69.06G][简繁英字幕][4K-2160P][杜比视界版本][H265][Netflix][流媒体] [BT下载][悬案解码][全9集][WEB-MKV/48.38G][简繁英字幕][4K-2160P][H265][Netflix][流媒体][BlackTV] [BT下载][德斯特][第01-03集][WEB-MKV/22.57G][简繁英字幕][4K-2160P][HDR+杜比视界双版本][H265][流媒体][ Win10系统怎么调回正常桌面？Win10系统调回正常桌面方法步骤 Win7升级Win10启动不了怎么解决？Win7升级Win10启动不了解决方法 Windows11无线显示安装失败怎么办？Windows11无线显示安装失败解决方法 Win10/11遇到错误代码0x8007139f如何解决？ Win11显示桌面按钮不见了怎么办？Win11显示桌面按钮不见了解决方法更新Windows11时提示你需要关注的事项怎么解决？ 2021年9月最新显卡天梯图显卡天梯图性能排行榜2021年9月高清完整版 2021年9月最新CPU天梯图 2021最新最全CPU性能高清完整版 0x00006ba错误代码是什么意思？0x00006ba错误代码解决办法剪映如何设置视频的饱和度？剪映设置视频的饱和度的方法