本书结合SQL Server 2005环境进行讲解,与市场主流开发工具和技术保持同步。本书可读性强,易读易用,即使是初学者,阅读起来也比较容易。概念清晰,条理清楚,内容取舍合理。书强调基础,重视实例。各章节都以经典算法为主,介绍其主要思想和基本原理,并且给出恰当和丰富的实例。书中实例和课后习题实用、丰富,通过练习,读者可以对各个知识点从不同角度得到训练,巩固和掌握所学知识。
本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。
本书既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2005进行了操作实现。本书通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。本书每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步巩固和掌握所学知识。此外,本书提供多媒体教学课件和习题参考答案,读者可到清华大学出版社网站(http://www.tup.com.cn/)下载。
本书可以作为高等学校计算机及相关专业本科、研究生的数据仓库和数据挖掘教材,也可供相关领域的广大科技工作人员和高校师生参考。
第1章 数据仓库的概念与体系结构
1.1 数据仓库的概念、特点与组成
1.1.1 数据仓库的特点
1.1.2 数据仓库的组成
1.2 数据挖掘的概念与方法
1.2.1 数据挖掘的分析方法
1.2.2 数据仓库与数据挖掘的关系
1.3 数据仓库的技术、方法与产品
1.3.1 OLAP技术
1.3.2 数据仓库实施的关键环节和技术
1.3.3 数据仓库实施方法论
1.3.4 常用的数据仓库产品
1.4 数据仓库系统的体系结构
1.4.1 独立的数据仓库体系结构
1.4.2 基于独立数据集市的数据仓库体系结构
1.4.3 基于依赖型数据集市和操作型数据存储的数据仓库体系结构
1.4.4 基于逻辑型数据集市和实时数据仓库的体系结构
1.5 数据仓库的产生、发展与未来
1.5.1 数据仓库的产生
1.5.2 数据仓库的发展
1.5.3 数据仓库的未来
1.6 小结
1.7 习题
第2章 数据仓库的数据存储与处理
第3章 数据仓库系统的设计与开发
第4章 关联规则
第5章 数据分类
第6章 数据聚类
第7章 贝叶斯网络
第8章 粗糙集
第9章 神经网络
第10章 遗传算法
第11章 统计分析
第12章 文本和Web挖掘
参考文献