网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 数据仓库与数据挖掘(计算机科学与技术学科研究生教材)
分类
作者 李雄飞//杜钦生//吴昊
出版社 机械工业出版社
下载
简介
目录

前  言

教学建议

第1章 绪论1

 1.1 引言1

 1.2 数据仓库2

  1.2.1 从数据库到数据仓库4

  1.2.2 数据仓库的基本概念6

  1.2.3 数据仓库的体系结构7

 1.3 数据挖掘8

  1.3.1 KDD与数据挖掘9

  1.3.2 数据库与数据挖掘发展历程11

  1.3.3 数据挖掘的特征与对象12

  1.3.4 数据挖掘相关领域17

 1.4 数据仓库与数据挖掘的关系18

 1.5 应用前景与发展趋势18

 本章小结19

 习题120

第2章 联机分析处理21

 2.1 引言21

 2.2 OLAP的定义21

 2.3 OLAP的相关概念22

 2.4 OLAP与OLTP的关系和比较23

 2.5 OLAP准则25

 2.6 多维数据分析方法25

 2.7 关系数据的组织27

 2.8 多维数据的存储方式30

 2.9 OLAP体系结构32

 2.10 OLAP的展现方式34

 2.11 OLAP工具的评价指标35

 2.12 OLAP的局限性36

 本章小结37

 习题237

第3章 数据仓库的设计与开发39

 3.1 引言39

 3.2 数据仓库的数据模型概述39

 3.3 数据仓库的分析与设计41

  3.3.1 需求分析41

  3.3.2 概念模型设计41

  3.3.3 逻辑模型设计42

  3.3.4 物理模型设计46

  3.3.5 数据仓库的索引技术47

 3.4 数据仓库的开发49

  3.4.1 风险因素49

  3.4.2 数据仓库系统的生命周期49

  3.4.3 建立数据仓库系统的思维模式52

  3.4.4 数据仓库数据库的设计步骤53

  3.4.5 数据质量与数据清洗53

  3.4.6 数据粒度与维度建模54

  3.4.7 选择数据仓库工具55

  3.4.8 提高数据仓库性能55

  3.4.9 数据仓库的安全性56

 3.5 主要的数据仓库产品57

 本章小结58

 习题358

第4章 关联规则60

 4.1 引言60

 4.2 关联规则模型61

 4.3 Apriori算法62

  4.3.1 发现频繁项集62

  4.3.2 生成关联规则67

 4.4 频繁模式增长算法76

  4.4.1 建树方法77

  4.4.2 用FP树挖掘频繁模式78

 4.5 关联规则模型扩展80

  4.5.1 多级关联规则81

  4.5.2 多维关联规则83

 本章小结86

 习题486

第5章 粗糙集88

 5.1 引言88

 5.2 近似空间89

  5.2.1 近似空间与不可分辨关系89

  5.2.2 知识与知识库90

 5.3 近似与粗糙集91

  5.3.1 基本概念91

  5.3.2 基本性质93

 5.4 描述粗糙集的特征的方法95

  5.4.1 近似精度95

  5.4.2 拓扑特征96

 5.5 信息系统97

  5.5.1 信息系统的定义97

  5.5.2 约简和核99

  5.5.3 分辨矩阵与分辨函数100

  5.5.4 信息系统约简101

 5.6 决策表103

  5.6.1 相对约简与知识依赖性103

  5.6.2 决策表及其约简105

  5.6.3 近似约简算法110

  5.6.4 决策规则111

 本章小结112

 习题5113

第6章 决策树115

 6.1 引言115

 6.2 构建决策树的理论问题116

  6.2.1 为当前结点选择属性117

  6.2.2 过拟合问题120

 6.3 ID3算法123

  6.3.1 生成决策树的算法123

  6.3.2 生成规则和决策127

 6.4 决策树的剪枝129

  6.4.1 预剪枝129

  6.4.2 后剪枝130

 6.5 C4.5算法133

 本章小结135

 习题6136

第7章 聚类分析137

 7.1 引言137

 7.2 聚类分析简介137

  7.2.1 聚类分析137

  7.2.2 聚类分析应用领域与算法特征137

 7.3 数据类型、距离和相似系数140

  7.3.1 数据类型140

  7.3.2 距离和相似系数141

 7.4 聚类方法与聚类分类145

  7.4.1 聚类方法145

  7.4.2 聚类方法的分类146

 7.5 划分方法147

  7.5.1 k-均值算法148

  7.5.2 k-中心点算法149

  7.5.3 关于参数K151

  7.5.4 EM聚类152

 7.6 层次方法156

  7.6.1 层次聚类中的距离度量156

  7.6.2 分裂方法157

  7.6.3 凝聚方法157

 7.7 基于密度的方法158

  7.7.1 DBSCAN算法158

  7.7.2 矢量感应聚类算法160

 7.8 聚类评估163

  7.8.1 假设检验164

  7.8.2 聚类评估中的假设检验166

  7.8.3 相对准则169

 本章小结169

 习题7169

第8章 兴趣度量171

 8.1 引言171

 8.2 用于关联规则和分类规则的度量173

  8.2.1 客观度量174

  8.2.2 主观度量181

  8.2.3 语义度量184

 8.3 用于总结的度量186

 8.4 分类器的兴趣度189

 本章小结192

 习题8192

第9章 应用案例194

 9.1 数据仓库应用案例194

  9.1.1 案例一:网络购物数据仓库194

  9.1.2 案例二:社会保障卡数据仓库197

  9.1.3 案例三:医院信息系统数据仓库202

 9.2 数据挖掘应用案例207

  9.2.1 案例一:零售商系统货篮数据挖掘207

  9.2.2 案例二:通信用户满意度指数评测212

  9.2.3 案例三:城市环境质量评价217

 本章小结220

参考文献221

内容推荐

科技的进步,特别是信息产业的发展,把整个社会带入一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据仓库与数据挖掘技术的应用领域越来越广泛。

李雄飞等编的《数据仓库与数据挖掘(计算机科学与技术学科研究生教材)》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、OLAP等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。

《数据仓库与数据挖掘(计算机科学与技术学科研究生教材)》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。

编辑推荐

李雄飞等编的《数据仓库与数据挖掘(计算机科学与技术学科研究生教材)》注重内容的科学性、技术性和工程性。基本原理部分尽量做到严谨、完整。技术实现和技巧性上力求经典、特征突出。在工程方面节选部分成功案例,期望以点带面。在教学过程中可以根据学时数、专业特点、课程性质等对教学内容适当取舍。

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/3 9:26:13