网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | R语言数据高效处理指南 |
分类 | |
作者 | 黄天元 |
出版社 | 北京大学出版社 |
下载 | ![]() |
简介 | 作者简介 黄天元,复旦大学博士在读,R语言忠实爱好者。热爱数据科学与开源工具,致力于利用数据科学迅速积累行业经验和科学知识,涉猎内容包括信息计量、机器学习、数据可视化、统计建模、知识图谱等。已发表SCl论文两篇,开设有知乎专栏“R语言数据挖掘”。 目录 第1部分 基础知识 第1章 数据处理总论 1.1 数据处理的定义 1.2 数据处理的意义 1.3 数据处理基本工具 第2章 R语言编程基础 2.1 下载安装 2.2 包的使用 2.3 数据类型 2.4 数据结构 2.5 程序控制 2.6 函数式编程 第3章 数据处理基本范式 第2部分 快速入门 第4章 base-r:基本数据处理 4.1 数据集及其基本探索 4.2 基本范式实现 4.2.1 创建(read.csv/data.frame) 4.2.2 删除(rm) 4.2.3 检索(DF[i,j]) 4.2.4 插入(rbind/cbind) 4.2.5 排序(order) 4.2.6 过滤(DF[condition,]) 4.2.7 汇总(apply) 4.2.8 分组(aggregate) 4.2.9 连接(merge) 第5章 tidyverse 生态系统:简洁高效数据处理 5.1 tidyverse 生态系统简介 5.2 基本范式实现 5.2.1 包的加载(p_load) 5.2.2 创建(read_csv/tibble) 5.2.3 删除(rm) 5.2.4 检索(select/slice) 5.2.5 插入(add/bind) 5.2.6 排序(arrange) 5.2.7 过滤(filter) 5.2.8 汇总(summarise) 5.2.9 分组(group_by) 5.2.10 连接(join) 5.3 高级处理工具 5.3.1 长宽数据变换(gather/spread) 5.3.2 集合运算(intersect/union/setdiff) 5.3.3 窗口函数(rank/lead/lag/cum) 5.3.4 连接数据库:对SQL 的支持(dbplyr) 5.3.5 巧妙写函数:变量的引用 第3部分 高级进阶 第6章 data.table:高速数据处理 6.1 data.table 简介 6.2 基本范式实现 6.3 高级特性探索 第7章 sparklyr: 分布式数据处理 7.1 连接R 与Spark:sparklyr 包简介 7.2 基本操作指南 7.3 存储机制简介 7.4 分布式计算 第4部分 实战应用 第8章 航班飞行数据演练 8.1 nycflights13 数据集探索 8.2 flights14 数据集探索 第9章 测试 第10章 实用数据处理技巧 10.1 数据存取 10.1.1 令人头疼的编码格式(encoding) 10.1.2 读写性能竞速赛(fst/feather & data.table/readr) 10.1.3 数据存取转换的瑞士军刀(rio) 10.2 并行计算(doParallel) 10.3 混合编程 第11章 实战案例:网络爬虫与文本挖掘 11.1 网络爬取(rvest) 11.2 文本挖掘(tidytext) 第12章 实战案例:数据塑型与可视化(ggplot2) 12.1 数据准备 12.2 柱状图(geom_bar) 12.3 折线图(geom_line) 12.4 饼图(ggpie) 12.5 一行代码实现一页多图(gridExtra) 第13章 实战案例:机器学习 13.1 机器学习概述 13.2 为什么要做机器学习 13.3 如何入门机器学习 13.4 数据处理与机器学习 13.5 案例分析:信贷风险预测模型构建 致谢 内容推荐 R语言在近10年来已经发生了日新月异的变化,不仅在内容上更加丰富多彩,而且在计算效率上也有了大幅的提升。它被更加广泛地用于数据可视化、统计建模、机器学习等领域,而且还能实现网络爬虫、网络应用开发等功能,成为数据科学领域的全能型工具。R语言在学术界的地位已经不容置疑,在大数据时代中它是保证研究可重复性的重要工具。随着功能的日益完善,R语言已经进军工业界,并在金融、保险、医疗、生物和信息计量等不同的应用场景中大放异彩,潜力不可估量。 尽管R语言能够实现丰富多样的实际功能和框架,但是其本质是面向数据的,因此数据处理是R语言核心中的核心。如果能够掌握高效的数据操作技术,就能够在各类数据分析任务中如鱼得水。本书定位即为“R语言数据处理101”,希望R语言的使用者能够在较早的阶段就习得最基本而有效的数据处理基本技术。 本书读者群体包括在校的大学生、数据分析从业人员和致力于更加高效地处理数据的所有的R语言使用者。尽管对数据科学、计算机编程、统计学有一定基础会帮助理解本书的内容,但这不是必需的,来自包括初学者在内的各个层次的读者群体都能从本书中有所收获。读者在本书中不仅能够学到数据处理中的实用技术,还能培养在数据分析中的探索性思维。可以作为零基础学习数据分析的教程、进阶数据分析实用技巧的参考书、常备查询的案头工具书,以及具有一定趣味性的数据分析入门启蒙书。 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。