网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 数据挖掘(商业数据分析技术与实践)
分类 经济金融-管理-市场营销
作者 (美)盖丽特·徐茉莉//彼得·布鲁斯//米娅·斯蒂芬斯//尼廷·帕特尔
出版社 清华大学出版社
下载
简介
作者简介
盖丽特·徐茉莉博士是中国台湾地区清华大学服务科学研究所的特聘教授。自2004年以来,她在马里兰大学、印度商学院和中国台湾地区清华大学设计并指导了数据挖掘课程。徐茉莉教授以她在商业分析领域的研究和教学而闻名,她的研究方向是在信息系统和医疗保健方面的统计和数据挖掘方法。
阮敬(1979―),博士,现任首都经济贸易大学研究生院副院长,统计学院教授,北京市丰台区政协委员。兼任北京大数据协会副秘书长、中国统计教育学会常务理事兼高等教育分会副秘书长、中国商业统计学会常务理事、全国工业统计学教学研究会理事等职。
严雪林,现任SAS公司JMP事业部亚太区总经理,北京大数据协会副会长。兼任首都经济贸易大学统计学院兼职教授、全国应用统计专业学位研究生教育指导委员会“大数据硕士”兼职研究生导师、上海财经大学统计与管理学院兼职研究生导师,曾任JMP大中华地区总经理、SAS大中华地区市场及渠道总监、上海大学管理学院兼职教授、中央财经大学统计学院兼职教授等职。
周暐,硕士。现任SAS公司JMP事业部数据分析专家。兼任中国质量协会六西格玛专家委员会专家委员,上海财经大学统计与管理学院应用统计硕士研究生导师(兼职),曾在西门子(Siemens)通信运营部门工作多年。
目录

第一部分 预备知识

 1 导论

1.1 什么是商业分析?

1.2 什么是数据挖掘?

1.3 数据挖掘及相关用语

1.4 大数据

1.5 数据科学

1.6 为什么会有这么多不同的方法?

1.7 术语和符号

1.8 本书框架

 2 数据挖掘概述

2.1 引言

2.2 数据挖掘的核心思想

2.3 数据挖掘步骤

2.4 初步步骤

2.5 预测能力和过拟合

2.6 用JMP Pro建立预测模型

2.7 用JMP Pro进行数据挖掘

2.8 自动化数据挖掘解决方案

第二部分 数据探索与降维

 3 数据可视化

3.1 数据可视化的用途

3.2 数据实例

3.3 基本图形:条形图、折线图和散点图

3.4 多维可视化

3.5 特殊可视化

3.6 基于数据挖掘目标的主要可视化方案和操作概要

 4 降维

4.1 引言

4.2 维度灾难

4.3 实际考虑

4.4 数据汇总

4.5 相关分析

4.6 减少分类变量中的类别数量

4.7 将分类型变量转换为连续型变量

4.8 主成分分析

4.9 利用回归模型降维

4.10 利用分类和回归树降维

第三部分 性能评估

 5 评估预测效果

5.1 引言

5.2 评价预测性能

5.3 评判分类效果

5.4 评判分类性能

5.5 过采样

第四部分 预测与分类方法

 6 多元线性回归

6.1 引言

6.2 解释模型与预测模型

6.3 估计回归方程和预测

6.4 线性回归中的变量选择

 7 k近邻法

7.1 k-NN分类(分类型结果变量)

7.2 数值型结果变量下的k-NN方法

7.3 k-NN算法的优点和缺点

 8 朴素贝叶斯分类器

8.1 引言

8.2 使用完全(精确)贝叶斯分类器

8.3 朴素贝叶斯方法的优点和缺点

 9 分类和回归树

9.1 引言

9.2 分类树

9.3 生成树

9.4 评估分类树的效果

9.5 避免过拟合

9.6 树中的分类准则

9.7 多分类的分类树

9.8 回归树

9.9 树的优点和缺点

9.10 预测方法的提高:组合多棵树

9.11 不纯度的提取和度量

 10 逻辑回归

10.1 引言

10.2 逻辑回归模型

10.3 评价分类性能

10.4 完整分析案例:预测航班延误

10.5 附录:逻辑回归的概括

 11 神经网络

11.1 引言

11.2 神经网络的概念和结构

11.3 拟合数据

11.4 JMP Pro用户输入

11.5 探索预测变量和响应变量的关系

11.6 神经网络的优点和缺陷

 12 判别分析

12.1 引言

12.2 观测值到类的距离

12.3 从距离到倾向和分类

12.4 判别分析的分类性能

12.5 先验概率

12.6 多类别分类

12.7 优点和缺点

 13 组合方法:集成算法和增量模型

13.1 集成算法

13.2 增量(说服)模型

13.3 总结

第五部分 挖掘记录之间的关系

 14 聚类分析

14.1 引言

14.2 定义两个观测值之间的距离

14.3 定义两个类之间的距离

14.4 系统(凝聚)聚类

14.5 非系统聚类:k-means算法

第六部分 时间序列预测

 15 时间序列处理

15.1 引言

15.2 描述性与预测性建模

15.3 商业中的主流预测方法

15.4 时间序列的构成

15.5 数据分割和性能评价

 16 回归预测模型

16.1 趋势模型

16.2 季节模型

16.3 趋势和季节模型

16.4 自相关和ARIMA模型

 17 平滑法

17.1 引言

17.2 移动平均法

17.3 简单指数平滑法

17.4 高级指数平滑法

第七部分 案例

 18 案例

18.1 查尔斯图书俱乐部

18.2 德国信贷

18.3 太古软件编目

18.4 政治说教

18.5 出租车订单取消

18.6 浴皂的消费者细分

18.7 直邮筹款

18.8 破产预测

18.9 时间序列案例:预测公共交通需求

内容推荐

盖丽特·徐茉莉、彼得·布鲁斯、米娅·斯蒂芬斯、尼廷·帕特尔著的《数据挖掘(商业数据分析技术与实践)》采用SAS公司的统计软件包JMP Pro进行实践性应用,使用引人入胜的实际案例来构建关键数据挖掘方法(尤其是分类和预测的预测模型)的理论及其实践理解。本书所讨论的主题包括数据可视化、降维、聚类、线性和逻辑回归、分类和回归树、判别分析、朴素贝叶斯、人工神经网络、增量模型、集成算法以及时间序列预测等。

编辑推荐

盖丽特·徐茉莉、彼得·布鲁斯、米娅·斯蒂芬斯、尼廷·帕特尔著的《数据挖掘(商业数据分析技术与实践)》是一本非常优秀的教科书,适用于数据挖掘、预测分析和商业分析的本科生和研究生课程。本书也是数据科学家、分析师、研究人员和从业人员在管理、金融、市场营销、信息技术、医疗保健、教育和其他数据丰富的领域进行分析的独一无二的资源。

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/14 10:31:24