网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | R数据加工与分析呈现宝典/大数据应用与技术丛书 |
分类 | |
作者 | (美)乔纳森·卡罗尔 |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 作者简介 乔纳森·卡罗尔(Jonathan Carroll)是一位数据科学顾问,主要提供R编程服务。他拥有理论物理学的博士学位。 目录 第1章 数据与R语言介绍 1.1 什么是数据、数据在哪里以及如何处理数据 1.1.1 什么是数据 1.1.2 将周围的一切都视为数据源 1.1.3 数据再加工 1.1.4 使用处理得当的数据可以做些什么 1.1.5 数据就是资产 1.1.6 可重复的研究和版本控制 1.2 R语言介绍 1.2.1 R的起源 1.2.2 R能够以及不能完成哪些工作 1.3 R的运行机制 1.4 RStudio介绍 1.4.1 在RStudio中使用R 1.4.2 内置插件包(数据和函数) 1.4.3 内置文档 1.4.4 简介 1.5 亲自尝试 1.6 专业术语 1.7 本章小结 第2章 了解R数据类型 2.1 数据类型 2.1.1 数字 2.1.2 文本(字符串) 2.1.3 类别(因子) 2.1.4 日期和时间 2.1.5 逻辑值 2.1.6 缺失值 2.2 存储值(赋值) 2.2.1 命名数据(变量) 2.2.2 固定不变的数据 2.2.3 赋值运算符((-与=的对比) 2.3 指定数据类型 2.4 告知R忽略某些内容 2.5 亲自尝试 2.6 专业术语 2.7 本章小结 第3章 生成新数据值 3.1 基础数学算法 3.2 运算符优先顺序 3.3 字符串串联(连接) 3.4 比较 3.5 自动转换(强制) 3.6 亲自尝试 3.7 专业术语 3.8 本章小结 第4章 理解将要使用的工具:函数 4.1 函数 4.1.1 表象之下 4.1.2 函数模板 4.1.3 参数 4.1.4 多个参数 4.1.5 默认参数 4.1.6 参数名称匹配 4.1.7 部分匹配 4.1.8 作用域 4.2 插件包 4.2.1 安装插件包 4.2.2 R如何获知这个函数 4.2.3 名称空间 4.3 消息、警告和错误 4.3.1 创建消息、警告和错误 4.3.2 诊断消息、警告和错误 4.4 测试 4.5 项目:泛化一个函数 4.6 亲自尝试 4.7 专业术语 4.8 本章小结 第5章 组合数据值 5.1 简单集合 5.1.1 强制转换 5.1.2 缺失值 5.1.3 属性 5.1.4 名称 5.2 序列 5.2.1 向量函数 5.2.2 向量数学运算 5.3 矩阵 5.4 列表 5.5 data.frame 5.6 class属性 5.6.1 tibble类 5.6.2 将结构用作函数参数 5.7 亲自尝试 5.8 专业术语 5.9 本章小结 第6章 选取数据值 6.1 文本处理 6.1.1 文本匹配 6.1.2 子字符串 6.1.3 文本替换 6.1.4 正则表达式 6.2 从结构中选取组成部分 6.2.1 向量 6.2.2 列表 6.2.3 矩阵 6.3 值的替换 6.4 data.frame和dplyr 6.4.1 dplyr动词 6.4.2 非标准计算 6.4.3 管道 6.4.4 以困难方式对data.frame取子集 6.5 替换NA 6.6 条件式选取 6.7 汇总值 6.8 一个行之有效的示例:Excel与R的对比 6.9 亲自尝试 6.10 专业术语 6.11 本章小结 第7章 对大量数据进行处理 7.1 整洁数据原则 7.1.1 工作目录 7.1.2 存储数据格式 7.1.3 将数据读入R中 7.1.4 抓取数据 7.1.5 检查数据 7.1.6 处理数据中奇怪的值(警示值) 7.1.7 转换成整洁数据 7.2 合并数据 7.3 写出R中的数据 7.4 亲自尝试 7.5 专业术语 7.6 本章小结 第8章 根据条件进行处理:控制结构 8.1 循环 8.1.1 向量化 8.1.2 整洁的重复:使用purrr进行循环 8.1.3 for循环 8.2 更大或更小的循环作用域 8.3 条件式执行 8.3.1 if条件 8.3.2 ifelse条件 8.4 亲自尝试 8.5 专业术语 8.6 本章小结 第9章 数据可视化:绘图 9.1 数据准备 9.1.1 再次介绍整洁数据 9.1.2 数据类型的重要性 9.2 ggplot 9.2.1 通用构造 9.2.2 添加数据点 9.2.3 样式美学 9.2.4 添加线条 9.2.5 添加柱状图 9.2.6 其他图表类型 9.2.7 刻度 9.2.8 切面 9.2.9 额外的选项 9.3 作为对象的图表 9.4 保存图表 9.5 亲自尝试 9.6 专业术语 9.7 本章小结 第10章 借助扩展插件包对数据进行更多的处理 10.1 编写自己的插件包 10.1.1 创建一个最小化的插件包 10.1.2 文档 10.2 对插件包进行分析 10.2.1 单元测试 10.2.2 剖析 10.3 接下来做什么 10.3.1 回归分析 10.3.2 聚类分析 10.3.3 使用地图 10.3.4 与API进行交互 10.3.5 插件包共享 10.4 更多资源 10.5 专业术语 10.6 本章小结 附录A 安装R 附录B 安装RStudio 附录C base R中的图形 内容推荐 电子表格是胜任许多任务的强大工具,不过在需要解释、审查和呈现数据的情况下,使用它们就会显得有些力不从心。这是R编程的优势所在。R编程语言为正确处理所有类型的数据提供了一种舒适的环境,并且在开源的RStudio开发套件中,只要用鼠标键盘就可以简化复杂的操作,还可以为分析和报告创建可重现的处理过程。 本书将讲解如何使用R和RStudio从原始数据中提取有意义的信息。每一章精心编写的内容都涵盖了一种整理数据的独特方式,从理解个别值到与复杂数据集合进行交互,其中还包括如何从网络上抓取数据。本书还阐释了类似循环和条件的简单编程技术,以便让读者可以创建自定义函数。在阅读完本书之后,读者将掌握分析和可视化各类数据的多种策略。 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。