网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 商战数据挖掘
分类 教育考试-考试-计算机类
作者 (美) 福斯特·普罗沃斯特, 汤姆·福西特
出版社 人民邮电出版社
下载
简介
内容推荐
数据挖掘是现代企业从数据中提取有用信息、获取竞争优势的重要方法。针对数据科学的这一商业应用,本书进行了深入解读,不仅详细介绍了数据挖掘的环节、常用分析技术和基本模型,还提供了数据科学解决方案的提案示例和评估指南。同时,为了便于读者理解,本书不仅分析了大量商业示例,在业务情景下阐释数据挖掘的基本概念和原理,还使用大量图表辅助解释数学细节。因此,读者无需专业数学背景即可阅读本书。
目录
赞誉xiii


前言xv


章绪论:数据分析式思维1


1.1数据机遇无处不在1


1.2案例:飓风Frances2


1.3案例:预测用户流失3


1.4数据科学、数据工程和数据驱动型决策4


1.5数据处理和“大数据”6


1.6从大数据1.0到大数据2.06


1.7数据与数据科学能力:一种战略性资产7


1.8数据分析式思维9


1.9关于本书10


1.10重新审视数据挖掘和数据科学11


1.11数据科学:一门新兴的实验性学科12


1.12小结12


第2章商业问题及其数据科学解决方案14


2.1从商业问题到数据挖掘任务14


2.2有监督方法与无监督方法17


2.3数据挖掘及其结果18


2.4数据挖掘流程19


2.4.1业务理解环节20


2.4.2数据理解环节21


2.4.3数据准备环节22


2.4.4建模环节22


2.4.5评估环节23


2.4.6部署环节24


2.5管理数据科学团队的含义25


2.6其他分析技巧与技术26


2.6.1统计26


2.6.2数据库查询27


2.6.3数据仓库28


2.6.4回归分析28


2.6.5机器学习与数据挖掘28


2.6.6运用以上技术解决商业问题29


2.7小结30


第3章预测建模导论:从相关性到有监督的划分31


3.1建模、归纳与预测32


3.2有监督的划分35


3.2.1选取富信息属性36


3.2.2示例:基于信息增益进行属性选择42


3.2.3使用树形结构模型进行有监督的划分46


3.3划分的可视化52


3.4把树视作规则组53


3.5概率估计54


3.6示例:用树型归纳解决用户流失问题56


3.7小结59


第4章用模型拟合数据61


4.1根据数学函数分类62


4.1.1线性判别函数64


4.1.2目标函数的最优化66


4.1.3示例:基于数据挖掘线性判别式67


4.1.4用线性判别函数对实例进行评分和排序68


4.1.5支持向量机简介69


4.2通过数学函数进行回归71


4.3类概率估计和逻辑“回归”73


4.4示例:对比逻辑回归和树型归纳77


4.5非线性方程、支持向量机和神经网络81


4.6小结83


第5章避免过拟合84


5.1泛化能力84


5.2过拟合85


5.3过拟合检验86


5.3.1保留数据和拟合图86


5.3.2树型归纳的过拟合问题88


5.3.3数值函数的过拟合问题89


5.4示例:线性函数的过拟合90


5.5*示例:过拟合为何有害95


5.6从保留评估到交叉验证96


5.7用户流失数据集回顾99


5.8学习曲线100


5.9避免过拟合与控制复杂度101


5.9.1树型归纳中的过拟合规避102


5.9.2避免过拟合的一般方法102


5.9.3*参数优化中的过拟合规避104


5.10小结106


第6章相似性、近邻和簇107


6.1相似性和距离108


6.2最近邻推理109


6.2.1示例:威士忌分析110


6.2.2用最近邻来进行预测建模111


6.2.3近邻的数量及其影响113


6.2.4几何解释、过拟合和复杂度控制115


6.2.5最近邻方法的问题118


6.3与相似性和最近邻相关的一些重要技术细节119


6.3.1混合属性119


6.3.2*其他距离函数120


6.3.3*组合函数:计算近邻的评分122


6.4聚类124


6.4.1示例:威士忌分析回顾124


6.4.2层次聚类125


6.4.3最近邻回顾:根据形心的聚类128


6.4.4示例:对商业新闻报道进行聚类132


6.4.5理解聚类结果135


6.4.6*用有监督学习产生簇描述136


6.5退一步:解决业务问题与数据探索139


6.6小结140


第7章决策分析思维(一):如何评估一个模型142


7.1对分类器的评估143


7.1.1简单准确率的问题143


7.1.2混淆矩阵144


7.1.3样本类别不均衡的问题144


7.1.4成本收益不均衡的问题147


7.2分类问题的推广147


7.3一个重要的分析框架:期望值148


7.3.1用期望值规范分类器的使用148


7.3.2用期望值规范分类器的评估149


7.4评估、基线性能以及对数据投资的意义155


7.5小结157


第8章模型性能的可视化159


8.1排序,而不是分类159


8.2利润曲线161


8.3ROC图像和曲线163


8.4ROC曲线下面积168


8.5累积响应曲线和提升曲线168


8.6示例:用户流失模型的性能分析171


8.7小结177


第9章证据和概率179


9.1示例:向线上目标用户投放广告179


9.2根据概率合并证据181


9.2.1联合概率与独立性181


9.2.2贝叶斯法则182


9.3将贝叶斯法则应用到数据科学中183


9.3.1条件独立和朴素贝叶斯184


9.3.2朴素贝叶斯的优劣势186


9.4证据“提升度”的模型187


9.5示例:Facebook“点赞”的证据提升度188


9.6小结190


0章文本的表示和挖掘191


10.1为什么文本很重要192


10.2为什么文本很难处理192


10.3表示法193


10.3.1词袋模型193


10.3.2词频193


10.3.3度量稀疏度:逆文档频率195


10.3.4TFIDF196


10.4示例:爵士音乐家197


10.5*IDF和熵的关系200


10.6词袋模型之外的方法202


10.6.1n-grams序列202


10.6.2命名实体提取202


10.6.3主题模型203


10.7示例:通过挖掘新闻报道预测股价变动204


10.7.1任务204


10.7.2数据205


10.7.3数据处理207


10.7.4结果208


10.8小结211


1章决策分析思维(二):面向分析工程212


11.1为慈善机构寻找最佳捐赠人213


11.1.1期望值框架:分解商业问题,重组解决方案213


11.1.2简短的题外话:选择性偏差214


11.2更复杂的用户流失示例回顾215


11.2.1期望值框架:构建更复杂的商业问题215


11.2.2评估激励的影响216


11.2.3从期望值分解到数据科学解决方案217


11.3小结219


2章其他数据科学任务与技术220


12.1共现和关联:寻找匹配项221


12.1.1度量意外:提升度和杠杆率221


12.1.2示例:啤酒和彩票222


12.1.3Facebook点赞的关联223


12.2用户画像:寻找典型行为225


12.3链路预测和社交推荐229


12.4数据约简、潜在信息和电影推荐230


12.5偏差、方差和集成方法233


12.6数据驱动的因果解释和一个病毒式营销示例235


12.7小结236


3章数据科学和经营战略237


13.1数据分析式思维,终极版237


13.2用数据科学取得竞争优势238


13.3用数据科学保持竞争优势239


13.3.1令人敬畏的历史优势240


13.3.2独一无二的知识产权240


13.3.3独一无二的无形抵押资产240


13.3.4优秀的数据科学家241


13.3.5优秀的数据科学管理242


13.4吸引和培养数据科学家及其团队243


13.5检验数据科学案例分析244


13.6做好准备,接受来源各异的创意245


13.7做好准备,评估数据科学项目提案245


13.7.1数据挖掘提案示例246


13.7.2BigRed提案中的缺陷246


13.8企业的数据科学成熟度247


4章总结250


14.1数据科学的基本概念250


14.1.1将基本概念应用于新问题:挖掘移动设备数据252


14.1.2改变对商业问题解决方案的思考方式253


14.2数据做不到的:圈中人回顾254


14.3隐私、道德和挖掘个人数据256


14.4数据科学是否还有更多内容257


14.5最后一例:从众包到云包257


14.6最后的话258


附录A提案评估指南259


附录B另一个提案示例262


参考文献265


术语表273


关于作者278
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/22 20:58:13