![]()
内容推荐 本书主要介绍数据分析与数据挖掘的基本概念和方法,包括数据的基本属性和概念、数据预处理、数据仓库与联机分析处理、回归分析、频繁模式挖掘、分类、聚类、离群点检测。对书中每一部分先介绍基本概念、理论基础,再给出应用实例,便于读者更好地理解和应用算法,每章的很后给出习题。书中算法由浅入深、由原理到应用,有利于初学者的学习和理解。本书适用于数据分析与数据挖掘领域的初学者,可以作为相关专业本科生及研究生教材。本书也适合作为数据分析与数据挖掘相关专业人士的辅导教材。 作者简介 喻梅 天津大学智能与计算学部教授,硕士生导师。主要从事计算机网络、数据挖掘及数据库方向的研究及教学。研究重点为社交网络中实体社团的发现及识别、影响因素及发展规律;基于亲密度及影响力的微博社交兴趣圈挖掘算法等。在靠前会议及期刊上发表了多篇相关学术论文。担任多个靠前会议技术委员会委员,参与会议组织工作及专业技术服务。参与多部计算机教材的编写。 目录 章概述1 1.1数据分析与数据挖掘1 1.1.1数据分析1 1.1.2数据挖掘1 1.1.3数据分析与数据挖掘的区别和联系3 1.2分析与挖掘的数据类型3 1.3数据分析与数据挖掘的方法7 1.4数据分析与数据挖掘使用的技术8 1.5应用场景及存在的问题12 1.5.1数据分析与数据挖掘的应用12 1.5.2存在的主要问题13 1.6本书结构概述14 1.7习题14 第2章数据16 2.1数据对象与属性类别16 2.1.1属性的定义16 2.1.2属性的分类16 2.2数据的基本统计描述17 2.2.1中心趋势度量18 2.2.2数据分散度量20 2.2.3数据的图形显示22 2.3数据的相似性和相异性度量26 2.3.1数据矩阵与相异性矩阵26 2.3.2标称属性的邻近性度量27 2.3.3二元属性的邻近性度量28 2.3.4数值属性的相异性29 2.3.5序数属性的邻近性度量31 2.3.6混合类型属性的相异性31 2.3.7余弦相似性33 …… |