内容推荐 本书面向数据库知识发现的聚类任务,针对高维数据普遍具有的稀疏特征,系统阐述高维稀疏数据聚类知识发现的理论和方法。全书共12章,第1章和第2章系统总结聚类知识发现、高维稀疏数据聚类知识发现理论体系;第3~5章阐述高维稀疏数据聚类原理及分类属性数据、数值属性数据的系列聚类算法;第6~10章将高维稀疏数据聚类原理拓展到不完备数据、大规模数据、过程调整和参数自适应聚类;第11章阐述聚类趋势发现;第12章介绍高维稀疏数据聚类知识发现面向管理问题的应用、面向数据组织的应用及相关实现技术。 本书适用于数据挖掘领域的研究人员和应用人员,也可作为相关专业博士研究生、硕士研究生和本科生的参考书。 目录 前言 第1章 聚类知识发现 1.1 数据库知识发现 1.1.1 数据库知识发现的产生与发展 1.1.2 数据库知识发现的处理过程 1.1.3 数据库知识发现的主要任务 1.1.4 数据仓库与数据挖掘 1.2 数据类型及差异度计算 1.2.1 二值属性 1.2.2 分类属性 1.2.3 数值属性 1.2.4 混合属性 1.3 主要的聚类方法 1.3.1 分割聚类 1.3.2 层次聚类 1.3.3 基于密度的聚类 1.4 聚类方法的新进展 1.4.1 智能聚类 1.4.2 大数据聚类 1.5 本章要点 第2章 高维稀疏数据聚类知识发现理论体系 2.1 聚类研究的重点和难点 2.2 高维稀疏数据聚类问题 2.3 二值属性高维稀疏数据聚类原理 2.4 高维稀疏数据聚类拓展 2.4.1 分类、数值和混合属性数据 2.4.2 不完备数据 2.4.3 大规模数据 2.4.4 聚类过程调整 2.4.5 参数自适应 2.5 本章要点 第3章 二值属性高维稀疏数据聚类 3.1 概念基础 3.1.1 集合的稀疏差异度 3.1.2 集合的稀疏特征向量 3.1.3 稀疏特征向量的可加性 3.2 聚类过程 3.2.1 算法的两层结构 3.2.2 算法步骤 3.3 算法示例 3.3.1 聚类过程 3.3.2 聚类结果及分析 3.4 本章要点 第4章 分类属性高维稀疏数据聚类 4.1 基于稀疏特征向量的聚类 4.1.1 概念基础 4.1.2 算法步骤 4.1.3 分类属性数据聚类示例 4.1.4 分类属性稀疏数据聚类示例 4.2 基于集合差异度的聚类 4.2.1 概念基础 4.2.2 算法步骤 4.2.3 算法示例 4.3 拓展稀疏差异度聚类 4.3.1 集合的拓展稀疏差异度 4.3.2 集合的拓展稀疏特征向量 4.3.3 相关定理 4.3.4 算法步骤 4.4 稀疏性指数排序聚类 4.4.1 稀疏性指数相关概念 4.4.2 稀疏性指数排序 4.4.3 算法步骤 4.4.4 算法示例 4.5 不干涉序列加权排序聚类 4.5.1 不干涉序列指数 4.5.2 相关定理 4.5.3 排序示例 4.5.4 算法步骤 4.6 基于位集的聚类 4.6.1 分类属性数据对象的位集表示 4.6.2 位集差异度的定义及其性质 4.6.3 相关定理 4.6.4 算法步骤 4.7 本章要点 第5章 数值属性高维稀疏数据聚类 5.1 稀疏特征聚类 5.1.1 聚类思想 5.1.2 稀疏特征 5.1.3 对象的稀疏差异度 5.1.4 两阶段处理过程 5.1.5 算法步骤 5.1.6 算法示例 5.2 模糊离散化数据聚类 5.2.1 属性组合 5.2.2 模糊离散化 5.2.3 隶属度下限 5.2.4 算法步骤 5.2.5 算法示例 5.3 本章要点 第6章 不完备分类属性数据聚类 6.1 容差集合差异度聚类 6.1.1 容差集合差异度 6.1.2 容差集合精简 6.1.3 相关定理 6.1.4 算法步骤 6.2 约束容差集合差异度聚类 6.2.1 约束容差集合差异度 6.2.2 约束容差集合精简 6.2.3 相关定理 6.2.4 算法步骤 6.3 基于约束容差集合差异度聚类的缺失数据填补 6.3.1 填补思想 6.3.2 约束容差集合精简不变定理 6.3.3 填补过程 6.4 缺失数据填补实验分析 6.4.1 数据集 6.4.2 补齐率分析 6.4.3 填补正确率分析 6.4.4 填补后聚类正确率分析 6.4.5 时间效率分析 6.4.6 参数分析 6.5 本章要点 第7章 不完备混合属性数据聚类 7.1 对象混合差异度聚类 7.1.1 聚类思想 7.1.2 对象混合差异度 7.1.3 基于最近邻的初始原型对象选择 7.1.4 算法步骤 7.2 集合混合差异度聚类 7.2.1 集合混合差异度 7.2.2 集合混合特征向量 7.2.3 集合混合特征向量的可加性 7.2.4 算法步骤 7.3 基于集合混合差异度聚类的缺失数据填补 7.3.1 填补思想 7.3.2 概念基础 7.3.3 填补过程 7.4 缺失数据填补实验分析 7.4.1 数据集 7.4.2 分类属性填补分析 7.4.3 数值属性填补分析 7.5 本章要点 第8章 大规模高维稀疏数据聚类 8.1 基于抽样的聚类 8.1.1 基于抽 |