内容推荐 肖海军、胡鹏编著的《数据挖掘算法与R语言实现》在介绍R软件基本功能的基础上,介绍了数据挖掘十大经典算法的基本原理及相应的R语言实现范例,旨在使读者能够仿照范例快速掌握大数据分析的方法,从高维海量数据中挖掘有用的信息,使用合适的数据挖掘算法,解决实际问题。全书内容共12章,分别介绍R软件的使用方法、C4.5算法、k-means算法、CART算法、Apriori算法、EM算法、PageRank算法、AdaBoost算法、kNN算法、Naive Bayes算法、SVM算法及各算法的案例分析。本书理论部分简单明了,所有程序均经过R软件实际运行。本书各章自成体系,读者既可从头逐章学习,也可随意挑选自己需要的章节学习。读者可登录华信教育资源网www.hxedu.com.cn免费下载算法实例代码。 本书既可作为高年级本科生、研究生相关课程的教材,也可作为不同领域数据分析人员的工具书,还可作为零基础读者的自学教材。 目录 第1章 R软件的使用方法 1.1 R软件介绍和安装 1.1.1 R软件介绍 1.1.2 R软件的安装 1.1.3 R studio的安装 1.2 R语言基本运算 1.2.1 R语言的数值运算 1.2.2 R语言的向量 1.2.3 R语言的向量运算 1.3 R语言缺失数据 1.3.1 R语言缺失数据类型 1.3.2 R语言缺失数据识别 1.3.3 R语言缺失数据处理 1.4 矩阵的运算 1.4.1 矩阵建立 1.4.2 矩阵计算 1.4.3 矩阵分解 1.5 列表和数据框 1.5.1 列表介绍 1.5.2 数据框介绍 1.6 R软件的数据读/写 1.7 R软件包介绍 1.7.1 包的基础知识 1.7.2 自动安装包 1.7.3 通过硬盘加载包 1.7.4 常见包介绍 1.8 R语言的函数 1.8.1 循环结构 1.8.2 条件执行结构 1.8.3 自定义函数 1.9 R软件绘图功能介绍 1.9.1 高ji绘图函数 1.9.2 低级绘图函数 1.9.3 用ggplot2包进行绘图 第2章 C4.5算法 2.1 算法简介 2.2 算法基本原理 2.3 算法的R语言实现 2.3.1 ctree函数介绍 2.3.2 C4.5决策树的R语言实例 2.4 小结 参考文献 第3章 k-means算法 3.1 算法简介 3.2 算法基本原理 3.3 算法的R语言实现 3.3.1 kmeans函数介绍 3.3.2 k-means聚类的R语言实例 3.4 小结 参考文献 第4章 CART算法 4.1 算法简介 4.2 算法基本原理 4.2.1 CART算法的建树 4.2.2 CART算法的剪枝 4.2.3 算法过程实例 4.3 算法的R语言实现 4.3.1 rpart函数介绍 4.3.2 CART决策树的R语言实例 4.3.3 rpart函数的补充说明 4.4 小结 参考文献 第5章 Apriori算法 5.1 算法简介 5.2 算法基本原理 5.2.1 挖掘频繁模式和关联规则 5.2.2 Apriori算法 5.2.3 AprioriTid算法 5.2.4 挖掘顺序模式 5.2.5 Apriori算法的一种改进算法 5.3 算法的R语言实现算法 5.3.1 apriori函数介绍 5.3.2 Apriori模型 5.4 小结 参考文献 第6章 EM算法 6.1 算法简介 6.2 算法基本原理 6.2.1 基础理论 6.2.2 算法过程实例 6.3 算法的R语言实现 6.3.1 mclust函数介绍 6.3.2 EM标准模型的R语言实现 6.3.3 存在噪声的EM算法的R语言实现 6.3.4 EM算法应用于高斯混合模型(GMM) 6.3.5 EM算法应用于Iris数据集 6.4 小结 参考文献 第7章 PageRank算法 7.1 算法简介 7.2 算法基本原理 7.3 算法的R语言实现 7.3.1 page.rank函数介绍 7.3.2 igraph包实现PageRank算法 7.3.3 自定义PageRank算法的R语言实现 7.3.4 补充实例 7.4 小结 参考文献 第8章 AdaBoost算法 8.1 算法简介 8.2 算法基本原理 8.2.1 Boosting算法 8.2.2 AdaBoost算法 8.2.3 算法过程实例 8.3 算法的R语言实现 8.3.1 boosting函数介绍 8.3.2 R语言实例 8.4 小结 参考文献 第9章 kNN算法 9.1 算法简介 9.2 算法基本原理 9.2.1 算法描述 9.2.2 算法流程 9.3 算法的R语言实现 9.3.1 knn函数介绍 9.3.2 利用class包中的knn函数建立模型 9.3.3 kNN算法应用于Iris数据集 9.3.4 kNN算法应用于Breast数据集 9.4 小结 参考文献 第10章 Naive Bayes算法 10.1 算法简介 10.2 算法基本原理 10.2.1 基础理论 10.2.2 算法过程实例 10.3 算法的R语言实现 10.3.1 naiveBayes函数介绍 10.3.2 利用e1071包中的naiveBayes函数建立模型 10.3.3 算法拓展——其他改进的Naive Bayes算法 10.4 小结 参考文献 第11章 SVM算法 11.1 算法简介 11.2 算法基本原理 11.2.1 基础理论 11.2.2 软间隔优化 11.2.3 核映射 11.2.4 SVM算法的过程 11.2.5 SVC算法过程实例 11.3 算法的R语言实现 11.3.1 svm函数介绍 11.3.2 标准分类模型 11.3.3 多分类模型 11.3.4 SVM回归 11.3.5 SVM拓展包(kernlab包) 11.3.6 SVM算法应用于Iris数据集(e1071包) 11.3.7 SVM算法应用于Iris数据集(kernlab包) 11.4 小结 参考文献 第12章 案例分析 12.1 关联规则案例分析 12.1.1 问题描述 12.1.2 R语言实现过程 12.1.3 不同参数的Apriori模型 12.1.4 小结 12.2 kNN算法案例分析 12.2.1 问题描述 12.2.2 R语言实现过程 12.2.3 小结 12.3 Naive Bayes算法案例分析 12.3.1 问题描述 12.3.2 R语言实现过程 12.3.3 小结 12.4 CART算法案例分析 12.4.1 问题描述 12.4.2 R语言实现过程
|