内容推荐 林智章、张良均主编的《R语言编程基础(大数据人才培养规划教材)》以理论结合示例操作的方式,全面介绍了R语言编程基础及其知识的应用,讲解了利用R语言解决部分实际问题的方法。全书共7章:第1章为R语言概述,包括学习R语言的优势、R语言的编译环境、R包的获取及加载、R包的内置数据等;第2~6章主要介绍R语言的数据对象与数据读写、数据集基本处理、函数与控制流、初级绘图、高级绘图:第7章主要介绍可视化数据挖掘工具Rattle。本书的每章都包含了课后习题,通过练习帮助读者巩固所学的内容。 本书可以作为高校大数据技术类专业教材,也可作为大数据技术爱好者自学用书。 目录 第1章 R语言概述 1.1 认识R语言 1.1.1 R语言的基本信息 1.1.2 获取与安装R语言 1.1.3 介绍R语言的编辑窗口 1.2 认识R语言的编译环境 1.2.1 认识R语言的编译器RStudio 1.2.2 获取R语言的帮助 1.2.3 了解R语言的工作空间 1.3 使用R包 1.3.1 认识R包 1.3.2 安装与加载R包 1.3.3 掌握常用的R包 1.4 了解R包的内置数据集 1.5 小结 课后习题 第2章 数据对象与数据读写 2.1 查看数据类型 2.1.1 基本数据类型 2.1.2 查看与转换对象类型 2.2 判断数据结构 2.2.1 向量 2.2.2 矩阵 2.2.3 数组 2.2.4 数据框 2.2.5 列表 2.2.6 数据结构的判别与转换 2.3 读写不同数据源的数据 2.3.1 从键盘导入数据 2.3.2 读写带分隔符的文件 2.3.3 读写Excel文件 2.3.4 导入其他统计软件文件 2.3.5 导入数据库数据 2.3.6 导入网页数据 2.4 小结 课后习题 第3章 数据集基本处理 3.1 新增数据属性列 3.1.1 访问数据框变量 3.1.2 创建新变量 3.1.3 重命名变量 3.2 清洗数据 3.2.1 处理缺失值 3.2.2 处理日期变量 3.2.3 数据排序 3.2.4 合并数据集 3.3 选取变量及数据 3.3.1 选取变量 3.3.2 删除变量 3.3.3 使用subset函数选取数据 3.3.4 随机抽样 3.4 整合数据 3.4.1 使用SQL语句操作数据 3.4.2 汇总统计数据 3.4.3 重塑数据 3.5 处理字符数据 3.5.1 正则表达式 3.5.2 字符串处理函数 3.6 小结 课后习题 第4章 函数与控制流 4.1 使用常用函数及apply函数族处理数据 4.1.1 掌握处理数据的常用函数 4.1.2 使用apply函数族批量处理数据 4.2 编写条件分支语句 4.2.1 掌握if…else判断语句 4.2.2 使用switch分支语句 4.3 编写循环语句 4.3.1 使用for循环语句 4.3.2 掌握while循环语句 4.3.3 使用repeat-break循环语句 4.4 编写自定义函数 4.4.1 掌握自定义函数的方法 4.4.2 实现两个矩阵的乘积 4.5 小结 课后习题 第5章 初级绘图 5.1 绘制基础图形 5.1.1 分析数据分布情况 5.1.2 分析数据间的关系 5.1.3 绘制其他图形 5.2 修改图形参数 5.2.1 修改颜色 5.2.2 修改点符号与线条 5.2.3 修改文本属性 5.2.4 设置坐标轴 5.2.5 添加图例 5.3 绘制组合图形 5.3.1 par函数 5.3.2 layout函数 5.4 保存图形 5.5 小结 课后习题 第6章 绘图 6.1 使用lattice包绘图 6.1.1 lattice包绘图特色 6.1.2 使用lattice包 6.2 使用ggplot2包绘图 6.2.1 qplot函数 6.2.2 理解ggplot2包的语言逻辑 6.2.3 ggplot绘图 6.3 认识交互式绘图工具 6.3.1 使用rCharts包生成网页动态图片 6.3.2 利用googleVis包实现数据动态可视化 6.3.3 利用htmlwidgets包实现绘图的网页化分享 6.3.4 利用shiny包实现可交互的Web应用 6.4 小结 课后习题 第7章 可视化数据挖掘工具Rattle 7.1 了解并安装Rattle 7.1.1 认识Rattle 7.1.2 安装Rattle 7.1.3 使用Rattle功能 7.2 导入数据 7.2.1 导入CSV数据 7.2.2 导入ARFF数据 7.2.3 导入ODBC数据 7.2.4 R Dataset——导入其他数据源 7.2.5 导入RData File数据集 7.2.6 导入Library数据 7.3 探索数据 7.3.1 数据总体概况 7.3.2 数据分布探索 7.3.3 相关性 7.3.4 主成分 7.3.5 交互图 7.4 构建模型 7.4.1 聚类分析 7.4.2 关联规则 7.4.3 决策树 7.4.4 随机森林 7.5 评估模型 7.5.1 混淆矩阵 7.5.2 风险图 7.5.3 ROC图及相关图表 7.5.4 模型得分数据集 7.6 小结 课后习题 参考文献
|