本书详细阐述了与数据分析相关的基本解决方案,主要包括关联规则挖掘、基于内容的模糊逻辑推荐系统、协同过滤机制、基于深度神经网络的时序数据、Twitter文本情感分类、记录链接—随机和机器学习方案、流式数据聚类分析、分析并理解网络等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书既可作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | R语言数据分析项目开发实战 |
分类 | |
作者 | (印)戈皮·萨博拉曼尼 |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 内容推荐 本书详细阐述了与数据分析相关的基本解决方案,主要包括关联规则挖掘、基于内容的模糊逻辑推荐系统、协同过滤机制、基于深度神经网络的时序数据、Twitter文本情感分类、记录链接—随机和机器学习方案、流式数据聚类分析、分析并理解网络等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书既可作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。 目录 第1章 关联规则挖掘 1.1 理解推荐系统 1.1.1 事务 1.1.2 加权事务 1.1.3 Web应用程序 1.2 零售商用例和数据 1.3 关联规则挖掘 1.4 关联销售营销活动 1.4.1 杠杆效应 1.4.2 确信度 1.5 加权关联规则挖掘 1.6 基于超链接的主题搜索(HITS) 1.7 负关联规则 1.8 规则的可视化 1.9 封装 1.10 本章小结 第2章 基于内容的模糊逻辑推荐系统 2.1 基于内容的推荐系统 2.2 新闻聚合器用例和数据 2.3 设计基于内容的推荐引擎 2.3.1 构建相似度索引 2.3.2 搜索机制 2.4 完整的R代码 2.5 本章小结 第3章 协同过滤机制 3.1 协同过滤 3.1.1 基于内存的方案 3.1.2 基于模型的方案 3.1.3 隐因子模型方案 3.2 recommenderlab数据包 3.3 用例和数据 3.4 设计并实现协同过滤机制 3.4.1 评级矩阵 3.4.2 标准化 3.4.3 随机划分训练集和测试集 3.4.4 训练模型 3.5 完整的R代码 3.6 本章小结 第4章 基于深度神经网络的时序数据 4.1 时序数据 4.1.1 非季节性时序 4.1.2 季节性时序 4.1.3 回归问题 4.2 深度神经网络 4.2.1 前向循环 4.2.2 反向循环 4.3 MXNet数据包 4.4 MXNet中的符号编程 4.4.1 softmax激活函数 4.4.2 用例和数据 4.4.3 基于时序预测的深度网络 4.5 训练-测试集划分 4.6 完整的R代码 4.7 本章小结 第5章 Twitter文本情感分类 5.1 核密度估计 5.2 Twitter文本 5.3 情感分类 5.3.1 字典方法 5.3.2 机器学习方法 5.3.3 当前方案 5.4 基于字典的评级机制 5.5 文本预处理 5.5.1 词频逆文档频率(TFIDF)方案 5.5.2 Delta TDIDF 5.6 构建情感分析分类器 5.7 整合RShiny应用程序 5.8 完整的R代码 5.9 本章小结 第6章 记录链接—随机和机器学习方案 6.1 用例 6.2 使用RecordLinkage 6.2.1 特征生成 6.2.2 字符串比较 6.2.3 语音特征 6.3 随机记录链接 6.3.1 期望最大化方法 6.3.2 基于权重的方法 6.4 基于机器学习的记录链接 6.4.1 无监督学习 6.4.2 监督学习 6.5 构建RShiny应用程序 6.6 完整的R代码 6.6.1 特征生成 6.6.2 期望最大化方法 6.6.3 基于权重的方法 6.6.4 机器学习方法 6.6.5 RShiny应用程序 6.7 本章小结 第7章 流式数据聚类分析 7.1 流式数据及其面临的挑战 7.1.1 边界问题 7.1.2 漂移问题 7.1.3 单路处理 7.1.4 实行性 7.2 流式聚类 7.3 流数据包 7.3.1 数据流数据 7.3.2 作为静态模拟器的DSD 7.3.3 连接至内存、文件或数据库的DSD 7.3.4 in-flight操作 7.3.5 将DSD连接至真实的数据流 7.3.6 数据流任务 7.4 用例和数据 7.4.1 速度层 7.4.2 批处理层 7.4.3 蓄水池采样 7.5 完整的R代码 7.6 本章小结 第8章 分析并理解网络 8.1 R语言中的图 8.1.1 顶点的度 8.1.2 顶点强度 8.1.3 邻接矩阵 8.1.4 R中的更多网络 8.1.5 顶点的中心度 8.1.6 节点的远度和近度 8.1.7 计算节点间的最短路径 8.1.8 图的随机遍历 8.2 用例和数据 8.3 数据准备 8.4 商品网络分析 8.5 编写RShiny应用程序 8.6 完整的R代码 8.7 本章小结 序言 前 言本书向读者介绍了如何利用R数据包处理数 据分析等问题,其中包含了针对各类数据分析的不同R数据 包的功能,并帮助读者使用正确的数据包实现相关任务。 其中,每章将从头开始构建一个完整项目,进而帮助读者 更好地理解如何构建端到端的预测分析解决方案。本书涵 盖了不同的主题,包括利用R语言构建深度学习网络、流数 据分析、情绪分类以及推荐系统。本书内容第1章:关联规 则挖掘。通过事务处理数据构建推荐系统,并对关联销售 和促销行为进行识别。第2章:基于内容的模糊逻辑推荐系 统。将处理推荐系统中的“冷启动”问题,并尝试通过模 糊集方案解决包含多相似度的排名问题。第3章:协同过滤 机制。将对推荐系统的协同过滤机制引入不同的方案。第4 章:基于深度神经网络的时序数据。讨论MXNet R,即R语 言中的深度学习数据包。本章将利用MXNet构建一个深连接 网络,进而预测股票收盘价格。第5章:Twitter文本情感 分类。将考查R语言中Twitter数据的处理能力,并引入了 一种全新的情绪分类方式,即Delta Tfidf。除此之外, 还将利用基于朴素贝叶斯算法的核密度估计对情绪进行分 类。第6章:记录链接—随机和机器学习方案。主要讨论数 据管理方面的问题,以及如何利用recordLinkage数据包 在R语言中对此加以处理。第7章:流式数据聚类分析。将 解决R语言中的流数据处理、流数据集群、在线/离线集群 模型等问题。第8章:分析并理解网络。通过igraph数据包 执行R中的图分析,同时利用图算法解决产品网络分析等问 题。软件环境首先需要安装R。此外,本书代码采用R version 3.3.1(single candle版本)并在Mac OS达尔 文15.6.0环境下编写,同时兼容于Linux和Windows操作系 统。R代码的编写和编译则在RStudio version 0.99.491 编辑器中完成。适用读者本书将引领读者利用R语言以及高 级、高效的数据分析方法解决实际应用问题。因此,读者 应了解一些与R语言和数据分析相关的一些基本概念。本书 约定本书通过不同的文本风格区分相应的信息类型。下面 通过一些示例对此类风格以及具体含义的解释予以展示。 命令行输入或输出如下所示:zero.matrix.gup (- mx.nd.zeros(c(3,3), mx.gpu(0)) 图标则表示较为重 要的说明事项。 图标则表示提示信息和操作技巧。读者 反馈和客户支持欢迎读者对本书的建议或意见予以反馈。 对此,读者可向feedback@packtpub.com发送邮件,并以 书名作为邮件标题。若读者对本书有任何疑问,均可发送 邮件至questions@packtpub.com,我们将竭诚为您服务。 若读者针对某项技术具有专家级的见解,抑或计划撰写书 籍或完善某部著作的出版工作,则可访问 www.packtpub.com/authors。资源下载读者可访问 http://www.packtpub.com并通过个人账户下载示例代码 文件。另外,在http://www.packtpub.com/support中注 册成功后,我们将以电子邮件的方式将相关文件发与读者 。读者可根据下列步骤下载代码文件:? 利用电子邮件地 址和密码登录或注册我们的网站。? 单击SUPPORT选项卡 。? 单击Code Downloads & Errata。? 在Serach文本 框中输入书名。? 搜索需要下载代码文件的书名。? 从 下拉菜单中选择本书的购买方式。? 单击Code Download 按钮。当文件下载完毕后,确保使用下列最新版本软件解 压文件夹:? Windows系统下的WinRAR/7-Zip。? Mac 系统下的Zipeg/iZip/UnRarX。? Linux系统下的7- Zip/PeaZip。另外,读者还可访问GitHub获取本书的代码 包,对应网址为https://github.com/ PacktPublishing/R-Data-Analysis-Projects。此外, 读者还可访问https://github.com/PacktPublishing/以 了解丰富的代码和视频资源。勘误表尽管我们在最大程度 上做到尽善尽美,但错误依然在所难免。如果读者发现谬 误之处,无论是文字错误抑或是代码错误,还望不吝赐教 。对此,读者可访问http://www.packtpub. com/submit-errata,选取对应书籍,单击Errata Submission Form超链接,并输入相关问题的详细内容。 版权须知一直以来,互联网上的版权问题从未间断,Packt 出版社对此类问题异常重视。若读者在互联网上发现本书 任意形式的副本,请告知网络地址或网站名称,我们将对 此予以处理。关于盗版问题,读者可发送邮件至 copyright@packtpub.com。问题解答若读者对本书有任何 疑问,均可发送邮件至questions@packtpub.com,我们将 竭诚为您服务。 导语 本书向读者介绍了如何利用R数据包处理数据分析等问题,其中包含了针对各类数据分析的不同R数据包的功能,并帮助读者使用正确的数据包实现相关任务。其中,每章将从头开始构建一个完整项目,进而帮助读者更好地理解如何构建端到端的预测分析解决方案。本书涵盖了不同的主题,包括利用R语言构建深度学习网络、流数据分析、情绪分类以及推荐系统。 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。