网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据科学概念与实践(原书第2版)/数据科学与工程技术丛书 |
分类 | |
作者 | (美)维贾伊·库图//巴拉·德斯潘德 |
出版社 | 机械工业出版社 |
下载 | ![]() |
简介 | 内容推荐 数据科学已经成为从数据中提取价值的基本工具,任何企业都可以将数据收集、存储和处理作为其业务的一部分。本书搭建了一个易于理解的概念框架,帮助读者掌握数据科学的基础知识,并在学习理论的过程中同步使用RapidMiner平台进行实践。书中将分享实用的数据分析方法,讨论如何揭示隐藏的模式和关系,无论你是新手还是专家,都能借助这些方法做出更好的决策和预测。本书很好适合商务用户、数据分析师、商务分析师、工程师和分析专家以及任何与数据打交道的人。 作者简介 黄智濒,北京邮电大学计算机学院讲师,计算机体系结构博士,主讲数字逻辑和计算机体系结构课程。主要研究方向包括GPU加速及大规模并行计算等。 目录 赞誉 译者序 序言 前言 致谢 作者简介 章简介1 1.1AI、机器学习和数据科学2 1.2什么是数据科学3 1.2.1提取有意义的模式3 1.2.2构建表示模型3 1.2.3统计、机器学习和计算的结合4 1.2.4学习算法4 1.2.5相关领域4 1.3数据科学的案例5 1.3.1体量5 1.3.2维度5 1.3.3复杂问题6 1.4数据科学的分类6 1.5数据科学的算法7 1.6本书路线图8 1.6.1数据科学入门8 1.6.2练习使用RapidMiner8 1.6.3核心算法9 参考文献11 第2章数据科学过程12 2.1先验知识13 2.1.1目标13 2.1.2主题范围14 2.1.3数据14 2.1.4因果关系与相关性15 2.2数据准备15 2.2.1数据探索15 2.2.2数据质量16 2.2.3缺失值16 2.2.4数据类型和转换16 2.2.5转换17 2.2.6异常值17 2.2.7特征选择17 2.2.8数据采样17 2.3建模18 2.3.1训练数据集和测试数据集18 2.3.2学习算法19 2.3.3模型评估20 2.3.4集成模型20 2.4应用21 2.4.1生产准备21 2.4.2技术整合21 2.4.3响应时间21 2.4.4模型刷新22 2.4.5同化22 2.5知识22 参考文献23 第3章数据探索24 3.1数据探索的目标24 3.2数据集25 3.3描述性统计26 3.3.1单变量探索27 3.3.2多变量探索28 3.4数据可视化30 3.4.1单变量的可视化31 3.4.2多变量的可视化34 3.4.3可视化高维数据38 3.5数据探索的路线图40 参考文献41 第4章分类42 4.1决策树42 4.1.1工作原理42 4.1.2实现过程47 4.1.3小结55 4.2规则归纳56 4.2.1工作原理58 4.2.2实现过程60 4.2.3小结63 4.3k-NN(k-近邻)63 4.3.1工作原理64 4.3.2实现过程69 4.3.3小结71 4.4朴素贝叶斯71 4.4.1工作原理72 4.4.2实现过程77 4.4.3小结79 4.5人工神经网络80 4.5.1工作原理82 4.5.2实现过程84 4.5.3小结86 4.6支持向量机87 4.6.1工作原理89 4.6.2实现过程91 4.6.3小结95 4.7集成学习95 4.7.1工作原理97 4.7.2实现过程98 4.7.3小结105 参考文献105 第5章回归方法107 5.1线性回归107 5.1.1工作原理108 5.1.2实现过程112 5.1.3检查点117 5.2逻辑回归120 5.2.1工作原理122 5.2.2实现过程124 5.2.3总结要点127 5.3总结127 参考文献127 第6章关联分析128 6.1挖掘关联规则129 6.1.1项集130 6.1.2规则生成132 6.2Apriori算法133 6.3频繁模式增长算法136 6.3.1工作原理136 6.3.2实现过程138 6.4总结141 参考文献141 第7章聚类142 7.1k-means聚类145 7.1.1工作原理147 7.1.2实现过程149 7.2DBSCAN聚类153 7.2.1工作原理153 7.2.2实现过程155 7.3自组织映射158 7.3.1工作原理159 7.3.2实现过程161 参考文献166 第8章模型评估168 8.1混淆矩阵169 8.2ROC和AUC170 8.3提升曲线172 8.4实现过程174 8.5总结177 参考文献178 第9章文本挖掘179 9.1工作原理180 9.1.1词频–逆文档频率180 9.1.2词语181 9.2实现过程184 9.2.1实现1:关键词聚类184 9.2.2实现2:预测博客作者的性别187 9.3总结193 参考文献194 0章深度学习195 10.1AI冬天197 10.1.1AI冬天:20世纪70年代197 10.1.2冬季解冻:20世纪80年代198 10.1.3人工智能的春夏:2006年至今200 10.2工作原理201 10.2.1神经网络的回归模型201 10.2.2梯度下降法202 10.2.3需要反向传播204 10.2.4分类超过2个:softmax205 10.2.5卷积神经网络207 10.2.6密集层211 10.2.7随机失活层211 10.2.8循环神经网络212 10.2.9自动编码器213 10.2.10相关AI模型213 10.3实现过程214 10.4总结217 参考文献218 1章推荐引擎219 11.1推荐引擎的概念221 11.2协同过滤225 11.2.1基于邻域的方法226 11.2.2矩阵分解233 11.3基于内容的过滤238 11.3.1用户画像的计算239 11.3.2有监督学习方法245 11.4混合推荐器249 11.5总结250 参考文献251 2章时间序列预测253 12.1时间序列分解256 12.1.1经典分解258 12.1.2实现过程258 12.2基于平滑的方法260 12.2.1简单预测方法260 12.2.2指数平滑261 12.2.3实现过程263 12.3基于回归的方法264 12.3.1回归265 12.3.2周期性回归266 12.3.3集成移动平均自回归模型268 12.3.4周期性ARIMA272 12.4机器学习方法274 12.4.1窗口化275 12.4.2神经网络自回归280 …… |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。