本书作为一本专家级指南,全面介绍了SQL Server 2005中数据挖掘的功能,并且对这些功能的应用作了较为详尽的讲述。书中不但讲述了数据挖掘的核心概念,还讲述了数据挖掘的最新发展趋势,并给出了一些数据挖掘的最佳实践。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据挖掘原理与应用--SQL Server2005数据库(国外计算机科学经典教材) |
分类 | |
作者 | (美)唐//(美)麦克雷南 |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 编辑推荐 本书作为一本专家级指南,全面介绍了SQL Server 2005中数据挖掘的功能,并且对这些功能的应用作了较为详尽的讲述。书中不但讲述了数据挖掘的核心概念,还讲述了数据挖掘的最新发展趋势,并给出了一些数据挖掘的最佳实践。 目录 第1章 数据挖掘导论 1 1.1 什么是数据挖掘 1 1.2 数据挖掘解决的商业问题 4 1.3 数据挖掘的任务 5 1.3.1 分类 5 1.3.2 聚类 5 1.3.3 关联 6 1.3.4 回归 6 1.3.5 预测 7 1.3.6 序列分析 7 1.3.7 偏差分析 8 1.4 数据挖掘技术 8 1.5 数据流 9 1.6 数据挖掘项目的生命周期 10 1.6.1 第1步:数据收集 10 1.6.2 第2步:数据清理和转换 10 1.6.3 第3步:模型构建 12 1.6.4 第4步:模型评估 12 1.6.5 第5步:报告 13 1.6.6 第6步:预测(评分) 13 1.6.7 第7步:应用集成 13 1.6.8 第8步:模型管理 13 1.7 数据挖掘当前市场与主要厂商 14 1.7.1 数据挖掘市场的大小 14 1.7.2 主要生产厂商和产品 14 1.8 目前存在的问题及挑战 15 1.9 数据挖掘标准 16 1.10 OLE DB for DM规范和 XML for Analysis规范 16 1.10.1 用于数据挖掘的 SQL/Multimedia 17 1.10.2 Java数据挖掘API 18 1.10.3 预测模型标记语言 20 1.10.4 Crisp-DM模型 23 1.10.5 公共仓库元数据 24 1.11 数据挖掘的新趋势 25 1.12 本章小结 26 第2章 OLE DB for DM规范 27 2.1 OLE DB介绍 27 2.2 为什么使用OLE DB 进行数据挖掘 29 2.3 OLE DB for DM规范 中的基本概念 31 2.3.1 事例 31 2.3.2 事例键 32 2.3.3 嵌套键 32 2.3.4 事例表和嵌套表 33 2.3.5 标量列和表列 33 2.3.6 数据挖掘模型 33 2.3.7 模型创建 33 2.3.8 模型训练 33 2.3.9 模型预测 34 2.4 DMX 34 2.4.1 数据挖掘的3个步骤 34 2.4.2 预测函数 43 2.4.3 单例查询 50 2.4.4 仅仅使用内容进行预测 51 2.4.5 钻取模型的内容 52 2.4.6 内容查询 52 2.5 理解模式行集 52 2.5.1 Mining_Services模式行集 53 2.5.2 Service_Parameters模式行集 54 2.5.3 Mining_Models模式行集 54 2.5.4 Mining_Columns模式行集 55 2.5.5 Mining_Model_Content 模式行集 55 2.5.6 Query_Content模式行集 58 2.5.7 Mining_Functions模式行集 59 2.5.8 Model_PMML模式行集 60 2.6 理解用于挖掘结构的 DMX扩展 60 2.6.1 挖掘结构 60 2.6.2 挖掘结构的DMX扩展 61 2.6.3 Mining Structure模式行集 62 2.7 本章小结 63 第3章 实践SQL Server数据挖掘 65 3.1 BI Dev Studio介绍 65 3.1.1 理解用户界面 66 3.1.2 脱机模式和即时模式 68 3.2 设置数据源 72 3.2.1 数据源 72 3.2.2 使用数据源视图 74 3.3 创建和编辑模型 83 3.3.1 结构和模型 83 3.3.2 使用数据挖掘向导 83 3.3.3 创建MovieClick挖掘 结构和挖掘模型 88 3.3.4 使用数据挖掘设计器 89 3.4 处理 94 3.5 使用模型 96 3.5.1 了解模型查看器 96 3.5.2 使用挖掘准确性图表 98 3.5.3 为MovieClick模型 创建一个提升图 101 3.5.4 使用挖掘模型预测 101 3.5.5 针对MovieClick模型 执行查询 102 3.5.6 创建数据挖掘报表 103 3.6 使用SQL Server Management Studio 104 3.6.1 了解Management Studio 用户界面 105 3.6.2 使用对象资源管理器 106 3.6.3 使用查询编辑器 106 3.7 本章小结 107 第4章 Microsoft贝叶斯算法 109 4.1 贝叶斯算法介绍 109 4.2 理解贝叶斯算法的基本原理 110 4.3 贝叶斯算法的参数 112 4.4 使用贝叶斯算法 113 4.4.1 DMX 114 4.4.2 理解贝叶斯模型的内容 115 4.4.3 浏览贝叶斯模型 117 4.5 本章小结 120 第5章 Microsoft决策树算法 121 5.1 决策树算法介绍 121 5.2 决策树算法的基本原理 122 5.2.1 决策树生成的基本思想 122 5.2.2 处理变量中的多个状态 125 5.2.3 避免过度训练 125 5.2.4 结合先验知识 126 5.2.5 特征选择 126 5.2.6 使用连续的输入属性 127 5.2.7 回归 127 5.2.8 使用Microsoft决策树 算法进行关联分析 128 5.3 理解算法参数 129 5.4 使用决策树算法 131 5.4.1 DMX查询 131 5.4.2 模型内容 135 5.4.3 解释模型 136 5.5 本章小结 139 第6章 Microsoft时序算法 141 6.1 Microsoft时序算法介绍 141 6.2 Microsoft时序算法的 基本原理 142 6.2.1 自动回归 142 6.2.2 使用多个时间序列 144 6.2.3 自动回归树 144 6.2.4 季节性 145 6.2.5 预测历史 146 6.2.6 高速缓存预测 146 6.3 理解时序算法的参数 147 6.4 使用Microsoft时序算法 148 6.4.1 DMX查询 148 6.4.2 模型内容 152 6.4.3 模型解释 152 6.5 本章小结 155 第7章 Microsoft聚类算法 157 7.1 Microsoft聚类算法介绍 158 7.2 聚类算法的基本原理 159 7.2.1 硬聚类算法与软聚类算法 160 7.2.2 离散聚类 161 7.2.3 可伸缩聚类 162 7.2.4 聚类预测 163 7.3 聚类算法的参数 163 7.4 使用聚类模型 166 7.4.1 将聚类作为一个分析步骤 166 7.4.2 DMX 167 7.4.3 模型内容 169 7.4.4 理解聚类模型 169 7.5 本章小结 174 第8章 Microsoft序列聚类算法 175 8.1 Microsoft序列聚类算法介绍 175 8.2 Microsoft序列聚类算法 的基本原理 176 8.2.1 什么是马尔可夫链 176 8.2.2 马尔可夫链的阶 176 8.2.3 状态转移矩阵 177 8.2.4 使用马尔可夫链来 进行聚类 178 8.2.5 聚类分解 180 8.3 序列聚类算法的参数 180 8.4 使用序列聚类算法 181 8.4.1 DMX查询 181 8.4.2 模型内容 185 8.4.3 解释模型 185 8.5 本章小结 189 第9章 Microsoft关联规则算法 191 9.1 Microsoft关联规则算法介绍 191 9.2 关联规则算法的基本原理 192 9.2.1 理解关联规则算法 的基本概念 192 9.2.2 挖掘频繁项集 195 9.2.3 生成关联规则 198 9.2.4 预测 198 9.3 关联算法的参数 199 9.4 使用关联算法 200 9.4.1 DMX查询 200 9.4.2 模型内容 202 9.4.3 解释模型 203 9.5 本章小结 205 第10章 Microsoft神经网络算法 207 10.1 Microsoft神经网络算法 的基本原理 207 10.1.1 什么是神经网络 208 10.1.2 组合和激活 209 10.1.3 反向传播、误差函数 和共轭梯度 211 10.1.4 处理神经网络的 简单示例 212 10.1.5 规范化和映射 213 10.1.6 网络拓扑 214 10.1.7 训练终止条件 215 10.2 神经网络算法的参数 215 10.3 DMX查询 216 10.4 模型内容 218 10.5 解释模型 219 10.6 本章小结 221 第11章 挖掘OLAP立方体 223 11.1 OLAP介绍 224 11.1.1 理解星型模式和 雪花模式 225 11.1.2 理解维和层次 225 11.1.3 理解度量和度量组 226 11.1.4 理解立方体的处理 和存储 227 11.1.5 使用前摄缓存 228 11.1.6 查询立方体 228 11.2 执行计算 229 11.3 浏览立方体 230 11.4 理解统一维度模型 231 11.5 理解OLAP和数据挖掘 之间的关系 234 11.5.1 OLAP在聚集数据方面 给数据挖掘带来的好处 235 11.5.2 OLAP需要数据挖掘 来发现模式 235 11.5.3 OLAP挖掘与关系挖掘 236 11.6 使用向导和编辑器来 构建OLAP挖掘模型 237 11.6.1 使用数据挖掘向导 237 11.6.2 构建客户细分模型 237 11.6.3 创建购物篮模型 239 11.6.4 创建销售预测模型 242 11.6.5 使用数据挖掘编辑器 245 11.7 理解数据挖掘维 246 11.8 在DMX查询内部 使用MDX 248 11.9 将AMO用于OLAP 挖掘模型 249 11.10 本章小结 253 第12章 SQL Server集成服务 数据挖掘 255 12.1 SSIS介绍 255 12.1.1 理解SSIS包 257 12.1.2 任务流 257 12.1.3 数据流 259 12.2 在SSIS环境中进行 数据挖掘 261 12.2.1 数据挖掘任务 262 12.2.2 数据挖掘转换 267 12.3 本章小结 276 第13章 SQL Server数据挖掘 的体系结构 277 13.1 Analysis Services体系 结构介绍 277 13.2 XML for Analysis 278 13.2.1 XMLA的API 279 13.2.2 XMLA和Analysis Services 282 13.3 处理体系结构 283 13.4 数据挖掘管理 284 13.4.1 服务器配置 284 13.4.2 数据挖掘安全 285 13.5 本章小结 287 第14章 SQL Server数据挖掘编程 289 14.1 数据挖掘API 290 14.1.1 ADO 291 14.1.2 ADO.NET 291 14.1.3 ADOMD.NET 291 14.1.4 Server ADOMD 292 14.1.5 AMO 292 14.2 使用Analysis Services 的API 292 14.3 使用Microsoft.AnalysisServices 创建和管理挖掘模型 293 14.3.1 AMO的基本原理 294 14.3.2 AMO应用程序和安全 295 14.3.3 对象的创建 296 14.4 浏览和查询挖掘模型 305 14.4.1 使用ADOMD.NET 来预测 306 14.4.2 浏览模型 309 14.4.3 存储过程 311 14.4.4 编写存储过程 312 14.5 本章小结 317 第15章 实现一个Web交叉销售 应用程序 319 15.1 源数据描述 319 15.2 构建模型 320 15.2.1 确定数据挖掘任务 320 15.2.2 将决策树算法应用 于关联任务 320 15.2.3 使用关联规则算法 322 15.2.4 两个模型的比较 324 15.3 执行预测 325 15.3.1 批处理预测查询 325 15.3.2 使用单例预测查询 327 15.4 在Web应用程序中 集成预测功能 327 15.4.1 理解Web应用程序 的体系结构 327 15.4.2 设置权限 328 15.4.3 分析Web推荐应用 程序的样例代码 329 15.5 本章小结 332 第16章 使用Microsoft Excel 进行高级预测 333 16.1 针对会话模型来配置 Analysis Services 333 16.2 使用高级预测工具 334 16.3 ExcelTimeSeries插件的 体系结构 336 16.4 构建输入数据集 336 16.5 创建和训练挖掘模型 339 16.5.1 连接数据挖掘引擎 339 16.5.2 创建和训练 340 16.6 预测序列 342 16.7 结合所有代码 343 16.8 本章小结 346 第17章 扩展SQL Server数据挖掘 347 17.1 理解插件算法 347 17.1.1 插件算法的架构 348 17.1.2 插件算法的概念 348 17.1.3 模型的创建和处理 350 17.1.4 预测 351 17.1.5 内容导航 352 17.1.6 受托管的插件 352 17.1.7 安装插件算法 353 17.2 使用数据挖掘查看器 353 17.3 本章小结 354 第18章 总结与其他资源 355 18.1 重新回顾SQL Server 2005 数据挖掘的亮点 355 18.1.1 最新的算法 355 18.1.2 易于使用的工具 356 18.1.3 简单而强大的API 356 18.1.4 与同类BI技术的集成 357 18.2 探讨数据挖掘的新领域 及应用 357 18.3 延伸阅读 358 18.3.1 Microsoft数据挖掘 的资源 358 18.3.2 数据挖掘的其他资源 358 18.3.3 流行的数据挖掘 Web站点 359 18.3.4 流行的数据挖掘会议 359 附录A 导入数据集 361 A.1 数据集 361 A.1.1 MovieClick数据集 361 A.1.2 Voting Records数据集 363 A.1.3 FoodMart 2000数据集 364 A.1.4 College Plans数据集 364 A.2 导入数据集 364 附录B 支持的VBA函数和 Excel函数 369 附录C 学习资源 373 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。