网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据分析技术基础 |
分类 | |
作者 | 荣垂田 |
出版社 | 机械工业出版社 |
下载 | ![]() |
简介 | 内容推荐 大数据已发展成为一个学科。本书作为该领域的入门教材,在内容上尽可能覆盖大数据分析的基本理论和基本技术。全书共9章:第1章介绍大数据发展的背景和相关的理论知识;第2章介绍大数据的采集方法,以及数据采集案例;第3章介绍大数据处理平台Hadoop,以及Hadoop在不同系统平台上的安装和部署方法;第4章介绍MapReduce编程方法和开发工具,以及MapReduce编程实例;第5章介绍HDFS及其相关的操作方法;第6章介绍HBase及其相关的操作方法;第7章介绍Hive及其在不同平台上的安装和部署方法、应用案例;第8章介绍大数据处理平台Spark,以及Spark编程实例;第9章介绍NoSQL数据库,以及典型的NoSQL数据库系统。 本书可作为高等学校计算机、数据科学与大数据技术及人工智能或相关专业的本科生或研究生教材,也可供对大数据分析感兴趣的工程技术人员阅读参考。 目录 前 言第1章 大数据概述 111 大数据时代 1111 大数据的发展历程 1112 大数据发展的内在驱动力 212 大数据的相关概念 6121 大数据的5V特征 6122 大数据的相关定义 613 大数据的影响 814 大数据分析 9141 大数据分析的特点 9142 大数据分析的流程 9143 大数据分析的核心技术 10144 大数据分析的计算模式 1115 大数据的行业应用 12151 社交大数据 12152 医疗大数据 13153 房地产大数据 1316 大数据与其他领域的关系 14161 云计算、大数据和物联网 14162 大数据与人工智能 16习题 16第2章 大数据的采集 1821 大数据的来源 1822 大数据采集工具 1923 大数据预处理 1924 Nutch应用案例 20241 Nutch的安装和配置 21242 Nutch爬取与内容解析 2325 Scrapy应用案例 25251 Scrapy框架概述 25252 Scrapy的安装和配置 27253 Scrapy爬取实例 27254 总结 35习题 36第3章 大数据处理平台Hadoop 3731 Hadoop概述 37311 Hadoop的发展历程 37312 Hadoop的体系结构 38313 Hadoop的特点 3932 Hadoop的安装和配置 40321 准备工作 40322 Hadoop软件的安装和配置 42习题 64第4章 MapReduce编程 6641 MapReduce概述 6642 开发工具IntelliJ IDEA 6743 编程实例 71431 MapReduce经典入门程序——字数统计(WordCount) 71432 MapReduce经典进阶程序 81433 在集群上运行MapReduce程序 87习题 93第5章 HDFS 9451 HDFS概述 9452 HDFS的架构及特点 9553 文件格式及其访问方法 96531 TextFile 97532 SequenceFile 99533 MapFile 102534 RCFile 10654 分布式缓存 10955 HDFS Shell命令 11256 HDFS的其他访问方式 116习题 122第6章 HBase 12361 HBase概述 12362 HBase的数据模型 12463 HBase的逻辑结构 12564 HBase的架构及特点 12665 HBase的安装与配置 12966 HBase Shell命令 13567 使用Java API访问 HBase 140习题 145第7章 Hive 14671 Hive概述 14672 在本地安装运行Hive 147721 下载源文件 147722 修改配置文件 148723 启动Hive 150724 创建数据库和文件夹 152725 建表及加载数据 152726 测试Hive 15373 在Linux中安装Hive 155731 机器准备 155732 Hive安装包准备 155733 修改Hive配置文件 156734 修改Linux环境变量 157735 启动Hive和相关测试 158习题 159第8章 大数据处理平台Spark 16081 Spark概述 160811 Spark的概念 160812 学习Spark的原因 160813 Spark组件 161814 Spark任务执行过程 16282 Spark本地(Windows)安装 163821 安装Scala 163822 安装Hadoop 164823 安装Spark 16583 Spark集群安装 16684 Spark运行实例 169841 蒙特·卡罗算法求π 169842 WordCount程序 169习题 170第9章 NoSQL数据库 17191 NoSQL数据库概述 171911 NoSQL的产生 171912 互联网对关系数据库提出的新要求 172913 NoSQL数据库的分类 17292 MongoDB 173921 MongoDB概述 173922 MongoDB的优势 173923 MongoDB的安装 174924 MongoDB使用实例 17893 Redis 180931 Redis概述 180932 Redis的应用场景 181933 Redis的数据类型及操作 181934 Redis的安装 182935 Redis使用实例 18494 Memcached 185941 Memcached概述 185942 Memcached的应用场景 186943 Memcached的数据类型及操作 186944 Memcached的安装 187945 Memcached使用实例 188习题 189参考文献 190 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。