网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | R语言数据分析与挖掘 |
分类 | |
作者 | 杜宾 ..-[等] 编 |
出版社 | 中国铁道出版社有限公司 |
下载 | ![]() |
简介 | 作者简介 杜宾,男,教授,就职于江西财经大学。管理科学与工程专业博士,1971年10月出生,江西吉安人。主要从事信息系统、机器学习、管理决策、数据分析等领域的研究,主讲课程包括R语言数据分析基础、计算机应用技术、运营管理等。钱亮宏,男,毕业于上海交通大学电子信息与电气工程学院,1989年8月出生,拥有10年R语言使用经验,一直奋战在数据分析与挖掘领域的线,作为金融和互联网行业资深数据挖掘专家。黄勃:博士,讲师,2014年12月武汉大学博士毕业入职上海工程技术大学,主讲了8门本科课程。研究方向为软件工程,机器学习,人工智能。发表学术论文30多篇,其中SCI,EI、ISTP三大检索20篇;获发明和软件著作权5项,省部级科技进步奖2项;2016年获批国家自然科学基金一项。高永彬:博士、讲师,就职于上海工程技术大学,博士毕业于韩国全北国立大学,在模式识别、机器学习领域积累了大量的研究与实战经验。特别地,在基于深度学习技术的人脸识别以及车型检测技术进行了深入地研究,发表了近30篇期刊/会议论文,取得了丰厚的研究成果,发表在包括Information Sciences, Pattern Recognition Letters等高水平期刊中,其中SCI收录5篇,EI收录4篇。 目录 部分 统计分析基础章 概述11.1 为什么使用R语言21.2 R的安装 31.3 RStudio集成环境 41.4 R的基础操作 41.5包 91.6 结果的重用性 101.7 综合示例 111.8 大数据处理 111.9 数据挖掘 13小结 16习题 16第2章 数据访问 172.1数据集合 172.2数据结构 182.3数据的输入 272.4数据的输出 352.5数据集的标注 362.6处理数据对象的实用函数36小结 37习题 37第3章 数据操作 393.1一个示例 393.2创建新变量 413.3变量的重编码 423.4变量的重命名 433.5缺失值 443.6日期型数据 463.7类型转换 483.8数据排序 493.9数据集的合并 493.10数据集取子集 503.11使用SQL 语句操作数据框533.12一个数据处理难题 533.13数值和字符处理函数 543.14数据处理难题的一套解决方案613.15控制语句 663.16自定义函数 683.17重构与整合 70小结 73习题 73第4章 数据可视化 754.1创建图形 754.2简单示例 774.3图形参数 784.4添加文本、自定义坐标轴和图例834.5图形的组合 894.6条形图 934.7饼图 974.8直方图 994.9核密度图 1004.10点图 1054.11 ggplot2包 107小结 116习题 116第5章 概率与分布 1175.1随机抽样 1175.2概率分布 1185.3R的概率分布 1225.4常用分布的概率函数图1245.5中心极限定理及应用 127小结 132习题 132第6章 基本统计分析 1336.1描述性统计分析 1336.2频数表和列联表 1396.3相关系数 1486.4检验 1526.5组间差异的非参数检验154小结 157习题 157第7章 回归分析 1597.1概论 1607.2 OLS 回归 1617.3回归诊断 1707.4异常观测值 1797.5改进方法 1827.6选择“最佳”的回归模型1847.7深度分析 188小结 192习题 192第8章 方差分析 1958.1 基本概念 1958.2 ANOVA 模型拟合 1968.3 单因素方差分析 1988.4单因素协方差分析 2028.5双因素方差分析 2068.6重复测量方差分析 2088.7多元方差分析 2108.8回归实现ANOVA 214小结 216习题 216第二部分 机器学习实践第9章 大数据高性能计算 2189.1数据选择 2199.2数据聚合 2239.3数据引用 2259.4键与快速筛选 2289.5数据连接 2319.6数据变形 236小结 238习题 2380章 机器学习流程 23910.1数据探索 24010.2数据划分 24110.3数据填充 24210.4特征选择 24610.5建模与调优 25110.6测试与评估 257小结 260习题 2601章 有监督学习模型 26111.1线性回归模型 26311.2逻辑回归模型 26911.3线性判别分析模型 27511.4朴素贝叶斯模型 27511.5k近邻模型 27511.6决策树模型 28411.7随机森林模型 29911.8神经网络模型 30911.9支持向量机模型 319小结 330习题 3302章 无监督学习模型 33112.1 k均值聚类模型 33312.2 DBSCAN聚类模型 34112.3 AGNES层次聚类模型 34612.4关联分析模型 351小结 357习题 357参考文献 358 内容推荐 本书从R语言的使用出发,在重点介绍R语言编程基础、操作、可视化、统计、高性能计算和机器学习的同时,注重实践能力的培养和数据分析与挖掘素质的全面提高。 本书分为统计分析基础和机器学习实践两部分,共12章,内容包括R语言概述、数据访问、数据操作、数据可视化、概率与分布、基本统计分析、回归分析、方差分析、大数据高性能计算、机器学习流程、有监督学习模型、无监督学习模型。本书的重点是让学生了解R语言数据分析与挖掘的基本技能和操作方法,并与数据分析与挖掘的典型方法、算法和应用场景结合。 本书内容丰富、体系新颖、结构合理、文字精练,适合作为普通高等院校信息类、管理类和数学统计类专业的R语言数据分析与挖掘课程的教材,也可作为数据科学行业相关从业人员的自学用书。 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。