网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 套路!机器学习 |
分类 | 人文社科-社会科学-语言文字 |
作者 | 林荟主编 |
出版社 | 电子工业出版社 |
下载 | ![]() |
简介 | 作者简介 林荟,美国杜邦公司商业数据科学家,之前曾任爱荷华州立大学兽医学院统计咨询师及商学院统计咨询师。当选2017~2018美国统计协会市场营销统计项目。翻译出版了《应用预测建模》。研究兴趣是预测模型、机器学习、数据可视化、市场营销调查分析、自然语义处理和文本挖据。 目录 章 白话数据科学\t1 1.1 什么是数据科学\t3 1.2 什么是数据科学家\t5 1.2.1 数据科学家需要的技能\t6 1.2.2 数据科学算法总结\t10 1.3 数据科学可以解决什么问题\t20 1.3.1 前提要求\t20 1.3.2 问题种类\t22 1.4 小结\t25 第2章 数据集\t26 2.1 服装消费者数据\t26 2.2 航空公司满意度调查\t33 2.3 生猪疫情风险预测数据\t37 第3章 数据分析流程\t41 3.1 从问题到数据\t42 3.2 从数据到信息\t44 3.3 从信息到行动\t46 第4章 数据预处理\t47 4.1 介绍\t47 4.2 数据清理\t50 4.3 缺失值填补\t52 4.3.1 中位数或众数填补\t53 4.3.2 K-近邻填补\t54 4.3.3 装袋树填补\t56 4.4 中心化和标量化\t56 4.5 有偏分布\t59 4.6 处理离群点\t63 4.7 共线性\t66 4.8 稀疏变量\t70 4.9 编码名义变量\t71 4.10 小结\t73 第5章 数据操作\t75 5.1 数据读写\t76 5.1.1 取代传统数据框的tibble对象\t76 5.1.2 高效数据读写:readr包\t80 5.1.3 数据表对象读取\t83 5.2 数据整合\t91 5.2.1 base包:apply()\t91 5.2.2 plyr包:ddply()函数\t93 5.2.3 dplyr包\t96 5.3 数据整形\t102 5.3.1 reshape2包\t102 5.3.2 tidyr包\t105 5.4 小结\t107 第6章 基础建模技术\t109 6.1 有监督和无监督\t109 6.2 误差及其来源\t111 6.2.1 系统误差和随机误差\t111 6.2.2 因变量误差\t117 6.2.3 自变量误差\t121 6.3 数据划分和再抽样\t122 6.3.1 划分训练集和测试集\t123 6.3.2 重抽样\t131 6.4 小结\t135 第7章 模型评估度量\t136 7.1 回归模型评估度量\t136 7.2 分类模型评估度量\t139 7.2.1 Kappa统计量\t141 7.2.2 ROC曲线\t143 7.2.3 提升图\t145 7.3 小结\t146 第8章 特征工程\t148 8.1 特征构建\t149 8.2 特征提取\t152 8.2.1 初步探索特征\t153 8.2.2 主成分分析\t158 8.2.3 探索性因子分析\t163 8.2.4 高维标度化\t167 8.2.5 知识扩展:3种降维特征提取方法的理论\t171 8.3 特征选择\t177 8.3.1 过滤法\t178 8.3.2 绕封法\t188 8.4 小结\t195 第9章 线性回归及其衍生\t196 9.1 普通线性回归\t197 9.1.1 最小二乘线性模型\t197 9.1.2 回归诊断\t201 9.1.3 离群点、高杠杆点和强影响点\t204 9.2 收缩方法\t205 9.2.1 岭回归\t205 9.2.2 Lasso\t209 9.2.3 弹性网络\t212 9.3 知识扩展:LASSO的变量选择功能\t213 9.4 主成分和偏最小二乘回归\t215 9.5 小结\t221 0章 广义线性模型压缩方法\t222 10.1 初识GLMNET\t223 10.2 收缩线性回归\t227 10.3 逻辑回归\t235 10.3.1 普通逻辑回归\t235 10.3.2 收缩逻辑回归\t236 10.3.3 知识扩展:群组lasso逻辑回归\t239 10.4 收缩多项回归\t243 10.5 泊松收缩回归\t246 10.6 小结\t249 1章 树模型\t250 11.1 分裂准则\t252 11.2 树的修剪\t256 11.3 回归树和决策树\t260 11.4 装袋树\t268 11.5 随机森林\t273 11.6 助推法\t277 11.7 知识扩展:助推法的可加模型框架\t283 11.8 知识扩展:助推树的数学框架\t286 11.8.1 数学表达\t286 11.8.2 梯度助推数值优化\t289 11.9 小结\t290 2章 神经网络\t292 12.1 投影寻踪回归(PROJECTION PURSUIT REGRESSION)\t293 12.2 神经网络(NEURAL NETWORKS)\t296 12.3 神经网络拟合\t299 12.4 训练神经网络\t300 12.5 用CARET包训练神经网络\t302 12.6 小结\t311 参考文献\t312 内容推荐 数据科学家目前是北美最热门的职业之一,平均年薪突破10万美元。但数据科学并不是一个低门槛的行业,除了对数学、统计、计算机等相关领域的技术要求以外,还要相关应用领域的知识。本书的写作对象是那些现在从事数据分析相关行业,或者之后想从事数据分析行业的人,意在为实 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。