本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系编写而成。本书系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。
本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据挖掘--方法与应用(第2版清华大学计算机系列教材) |
分类 | |
作者 | |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 内容推荐 本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系编写而成。本书系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。 本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。 目录 第1章 绪论 1.1 应用背景 1.1.1 商业上的驱动 1.1.2 科学研究上的驱动 1.1.3 数据挖掘伴随着数据库数据库技术而出现 1.2 什么是数据挖掘 1.2.1 基本描述 1.2.2 知识发现知识发现 1.3 数据挖掘的主要技术 1.4 数据挖掘的主要研究内容 1.5 数据挖掘面临的主要问题 1.6 数据挖掘相关的资料 1.7 本书的总体章节安排 1.8 小结 参考文献 第2章 数据获取 2.1 引言 2.2 背景介绍 2.3 数据采集 2.3.1 数据发现 2.3.2 数据增强 2.3.3 数据生成 2.4 数据标注 2.4.1 利用现有标签 2.4.2 基于众包技术 2.4.3 使用弱监督学习的方法 2.5 提升已有数据和模型 2.5.1 提升已有数据 2.5.2 提升已有模型 2.6 技术选择指南 2.7 小结 参考文献 第3章 数据预处理 3.1 引言 3.2 数据预处理的基本概念 3.2.1 数据的基本概念 3.2.2 为什么要进行数据预处理 3.2.3 数据预处理的任务 3.3 数据的描述 3.3.1 描述数据的中心趋势 3.3.2 描述数据的分散程度 3.3.3 描述数据的其他方式 3.4 数据清洗 3.4.1 数据缺失的处理 3.4.2 数据清洗 3.5 数据集成和转换 3.5.1 数据集成 3.5.2 数据冗余 3.5.3 数据转换 3.6 数据归约和变换 3.6.1 数据归约 3.6.2 数据离散化 3.6.3 概念层次生成 3.7 小结 参考文献 第4章 数据仓库 4.1 引言 4.2 数据库基本概念回顾 4.2.1 数据库简介 4.2.2 表、记录和域 4.2.3 数据库管理系统 4.3 数据仓库简介 4.3.1 数据仓库特点 4.3.2 数据仓库概念 4.3.3 数据仓库作用 4.3.4 数据仓库与DBMS对比 4.3.5 分离数据仓库的原因 4.4 多维数据模型 4.4.1 数据立方体 4.4.2 概念模型 4.4.3 概念分层概念分层 4.4.4 典型OLAP操作 4.4.5 星型网络的查询模型 4.5 数据仓库结构 4.5.1 数据仓库设计 4.5.2 多层体系结构 4.6 数据仓库的功能 4.6.1 数据立方体的有效计算 4.6.2 索引OLAP数据 4.6.3 OLAP查询的有效处理 4.7 从数据仓库到数据挖掘 4.7.1 数据仓库应用 4.7.2 从OLAP到OLAM 4.8 小结 参考文献 第5章 相关性与关联规则 5.1 基本概念 5.1.1 潜在的应用 5.1.2 购物篮问题购物篮问题 5.1.3 频繁模式分析、闭项集和关联规则 5.2 频繁项集挖掘方法 5.2.1 Apriori算法 5.2.2 由频繁项集产生关联规则 5.2.3 提高Apriori的效率 5.2.4 挖掘频繁项集的模式增长方法 5.3 多种关联规则挖掘关联规则挖掘 5.3.1 挖掘多层关联规则 5.3.2 挖掘多维关联规则 5.3.3 挖掘量化关联规则 5.4 从关联分析到相关分析相关分析 5.4.1 相关分析 5.4.2 强规则不一定是有价值的 5.4.3 挖掘高度关联的模式 5.5 基于约束的频繁模式挖掘 5.5.1 关联规则的元规则制导挖掘 5.5.2 基于约束的模式生成:模式空间剪枝和数据空间剪枝 5.6 小结 参考文献 第6章 分类和预测 6.1 引言 6.2 基本概念 6.2.1 什么是分类 6.2.2 什么是预测 6.3 关于分类和预测的问题 6.3.1 准备分类和预测的数据 6.3.2 评价分类和预测方法 6.4 决策树决策树分类 6.4.1 决策树归纳 6.4.2 属性选择度量 6.4.3 提取分类规则 6.4.4 基本决策树归纳的增强 6.4.5 在大数据集中的分类 6.5 贝叶斯分类 6.5.1 贝叶斯定理 6.5.2 朴素贝叶斯分类朴素贝叶斯分类 6.5.3 贝叶斯信念网络贝叶斯信念网络 6.5.4 贝叶斯网络学习 6.6 神经网络 6.6.1 神经网络神经网络简介 6.6.2 多层神经网络 6.6.3 神经网络训练 6.6.4 后向传播 6.6.5 网络剪枝和规则抽取 6.7 支持向量机 6.7.1 数据线性可分的情况 6.7.2 数据线性不可分的情况 6.7.3 支持向量机和神经网络的对比 6.8 关联分类 6.8.1 为什么有效 6.8.2 常见关联分类算法 6.9 分类准确率 6.9.1 估计错误率 6.9.2 装袋装袋和提升提升 6.10 小结 参考文献 第7章 深度学习 7.1 引言 7.2 卷积神经网络 7.2.1 卷积运算 7.2.2 卷积层 7.2.3 池化层 7.2.4 典型结构及其应用 7.3 循环神经网络 7.3.1 循环神经网络 7.3.2 长短期记忆神经网络 7.3.3 门控循环单元网络 7.3.4 双向循环神经网络 7.3.5 典型结构及其应用 7.4 常用的深度学习框架 7.5 小结 参考文献 第8章 聚类分析 8.1 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。