前 言
教学建议
第1章 绪论1
1.1 引言1
1.2 数据仓库2
1.2.1 从数据库到数据仓库4
1.2.2 数据仓库的基本概念6
1.2.3 数据仓库的体系结构7
1.3 数据挖掘8
1.3.1 KDD与数据挖掘9
1.3.2 数据库与数据挖掘发展历程11
1.3.3 数据挖掘的特征与对象12
1.3.4 数据挖掘相关领域17
1.4 数据仓库与数据挖掘的关系18
1.5 应用前景与发展趋势18
本章小结19
习题120
第2章 联机分析处理21
2.1 引言21
2.2 OLAP的定义21
2.3 OLAP的相关概念22
2.4 OLAP与OLTP的关系和比较23
2.5 OLAP准则25
2.6 多维数据分析方法25
2.7 关系数据的组织27
2.8 多维数据的存储方式30
2.9 OLAP体系结构32
2.10 OLAP的展现方式34
2.11 OLAP工具的评价指标35
2.12 OLAP的局限性36
本章小结37
习题237
第3章 数据仓库的设计与开发39
3.1 引言39
3.2 数据仓库的数据模型概述39
3.3 数据仓库的分析与设计41
3.3.1 需求分析41
3.3.2 概念模型设计41
3.3.3 逻辑模型设计42
3.3.4 物理模型设计46
3.3.5 数据仓库的索引技术47
3.4 数据仓库的开发49
3.4.1 风险因素49
3.4.2 数据仓库系统的生命周期49
3.4.3 建立数据仓库系统的思维模式52
3.4.4 数据仓库数据库的设计步骤53
3.4.5 数据质量与数据清洗53
3.4.6 数据粒度与维度建模54
3.4.7 选择数据仓库工具55
3.4.8 提高数据仓库性能55
3.4.9 数据仓库的安全性56
3.5 主要的数据仓库产品57
本章小结58
习题358
第4章 关联规则60
4.1 引言60
4.2 关联规则模型61
4.3 Apriori算法62
4.3.1 发现频繁项集62
4.3.2 生成关联规则67
4.4 频繁模式增长算法76
4.4.1 建树方法77
4.4.2 用FP树挖掘频繁模式78
4.5 关联规则模型扩展80
4.5.1 多级关联规则81
4.5.2 多维关联规则83
本章小结86
习题486
第5章 粗糙集88
5.1 引言88
5.2 近似空间89
5.2.1 近似空间与不可分辨关系89
5.2.2 知识与知识库90
5.3 近似与粗糙集91
5.3.1 基本概念91
5.3.2 基本性质93
5.4 描述粗糙集的特征的方法95
5.4.1 近似精度95
5.4.2 拓扑特征96
5.5 信息系统97
5.5.1 信息系统的定义97
5.5.2 约简和核99
5.5.3 分辨矩阵与分辨函数100
5.5.4 信息系统约简101
5.6 决策表103
5.6.1 相对约简与知识依赖性103
5.6.2 决策表及其约简105
5.6.3 近似约简算法110
5.6.4 决策规则111
本章小结112
习题5113
第6章 决策树115
6.1 引言115
6.2 构建决策树的理论问题116
6.2.1 为当前结点选择属性117
6.2.2 过拟合问题120
6.3 ID3算法123
6.3.1 生成决策树的算法123
6.3.2 生成规则和决策127
6.4 决策树的剪枝129
6.4.1 预剪枝129
6.4.2 后剪枝130
6.5 C4.5算法133
本章小结135
习题6136
第7章 聚类分析137
7.1 引言137
7.2 聚类分析简介137
7.2.1 聚类分析137
7.2.2 聚类分析应用领域与算法特征137
7.3 数据类型、距离和相似系数140
7.3.1 数据类型140
7.3.2 距离和相似系数141
7.4 聚类方法与聚类分类145
7.4.1 聚类方法145
7.4.2 聚类方法的分类146
7.5 划分方法147
7.5.1 k-均值算法148
7.5.2 k-中心点算法149
7.5.3 关于参数K151
7.5.4 EM聚类152
7.6 层次方法156
7.6.1 层次聚类中的距离度量156
7.6.2 分裂方法157
7.6.3 凝聚方法157
7.7 基于密度的方法158
7.7.1 DBSCAN算法158
7.7.2 矢量感应聚类算法160
7.8 聚类评估163
7.8.1 假设检验164
7.8.2 聚类评估中的假设检验166
7.8.3 相对准则169
本章小结169
习题7169
第8章 兴趣度量171
8.1 引言171
8.2 用于关联规则和分类规则的度量173
8.2.1 客观度量174
8.2.2 主观度量181
8.2.3 语义度量184
8.3 用于总结的度量186
8.4 分类器的兴趣度189
本章小结192
习题8192
第9章 应用案例194
9.1 数据仓库应用案例194
9.1.1 案例一:网络购物数据仓库194
9.1.2 案例二:社会保障卡数据仓库197
9.1.3 案例三:医院信息系统数据仓库202
9.2 数据挖掘应用案例207
9.2.1 案例一:零售商系统货篮数据挖掘207
9.2.2 案例二:通信用户满意度指数评测212
9.2.3 案例三:城市环境质量评价217
本章小结220
参考文献221