![]()
内容推荐 本书主要在第1版的基础上增加了两个部分:第一个是关于时间序列模型的新章节(第9章),这是一个源于统计学的传统主题。第二个新增的章节是深度学习(第11章),它是机器学习的一个迅速崛起的子领域。除了增加这两个章节之外,本书中的文本和代码会以一种读者友好的新格式来整体呈现。新版会继续专注于使用流行的统计编程语言R来构建用例。对于深度学习这样的主题,我们建议采用Python语言来配合TensorFlow这样的框架。但是,在第2版中,我们会向读者展示如何在TensorFlow中使用R语言编程,因此如果读者只熟悉R,可以暂时无须学习Python。与第1版一样,我们通过各种实际用例保持了机器学习理论与应用的良好平衡,为读者提供了一个真正全面的机器学习主题集合。 目录 译者序 前言 第1章 机器学习和R语言入门 1.1 了解发展历程 1.1.1 统计学习 1.1.2 机器学习 1.1.3 人工智能 1.1.4 数据挖掘 1.1.5 数据科学 1.2 概率与统计 1.2.1 计数和概率的定义 1.2.2 事件和关系 1.2.3 随机性、概率和分布 1.2.4 置信区间和假设检验 1.3 R语言入门 1.3.1 基本组成部分 1.3.2 R语言的数据结构 1.3.3 子集处理 1.3.4 数和Apply系列 1.4 机器学习过程工作流 1.4.1 计划 1.4.2 探索 1.4.3 构建 1.4.4 评估 1.5 其他技术 1.6 小结 第2章 数据准备和探索 2.1 规划数据收集 2.1.1 变量类型 2.1.2 数据格式 2.1.3 数据源的类型 2.2 初始数据分析 2.2.1 初步印象 2.2.2 把多个数据源组织到一起 2.2.3 整理数据 2.2.4 补充更多信息 2.2.5 重塑 2.3 探索性数据分析 2.3.1 摘要统计量 2.3.2 矩 2.4 案例研究:信用卡欺诈 2.4.1 数据导入 2.4.2 数据变换 2.4.3 数据探索 2.5 小结 第3章 抽样与重抽样技术 3.1 介绍抽样技术 3.2 抽样的术语 3.2.1 样本 3.2.2 抽样分布 3.2.3 总群体的均值和方差 3.2.4 样本均值和方差 3.2.5 汇总的均值和方差 3.2.6 抽样点 3.2.7 抽样误差 3.2.8 抽样率 3.2.9 抽样偏误 …… 第4章 R语言里的数据可视化 第5章 特征工程 第6章 机器学习理论和实践 第7章 机器学习模型的评估 第8章 模型性能改进 第9章 时间序列模型 第10章 可扩展机器学习和相关技术 第11章 用Keras和Tensorflow进行深度学习 |