1. 实用性:书中详细介绍了大数据技术的实际应用,提供了实用的案例分析和实战经验分享。
2. 前沿内容:涵盖了新的大数据技术和工具,让读者能够紧跟技术发展的脚步。
3. 适用人群广泛:内容既适合大数据初学者,也适合已有经验的专家。每一章节都有深入浅出的讲解。
4. 实际问题解决:书中深入探讨了大数据在各个行业中的应用,提供了实际问题的解决方案。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据技术基础 |
分类 | 教育考试-考试-计算机类 |
作者 | 张成文 |
出版社 | 人民邮电出版社 |
下载 | ![]() |
简介 | 编辑推荐 1. 实用性:书中详细介绍了大数据技术的实际应用,提供了实用的案例分析和实战经验分享。 2. 前沿内容:涵盖了新的大数据技术和工具,让读者能够紧跟技术发展的脚步。 3. 适用人群广泛:内容既适合大数据初学者,也适合已有经验的专家。每一章节都有深入浅出的讲解。 4. 实际问题解决:书中深入探讨了大数据在各个行业中的应用,提供了实际问题的解决方案。 内容推荐 大数据技术作为处理海量数据的关键工具,在数据分析、数据计算、资源管理等领域得到广泛应用。本书从初学者的角度出发,全面系统地介绍了Python大数据分析、数据存储、离线计算与实时计算等基本概念与方法,并以大量案例帮助读者理解大数据技术的方方面面。此外,本书还介绍了Kafka、图数据处理、OLAP数据分析、分布式资源管理和大数据处理架构等知识,以帮助读者快速熟悉大数据技术,并应用大数据技术解决现实生活中的问题。 本书内容新颖,案例丰富,既可作为高等院校计算机、数据分析等相关专业的教学用书,也可供对大数据技术感兴趣的初学者,以及从事数据科学、大数据技术研究和应用开发的人员参考。 目录 第 1章 大数据概述\t1 1.1 基本概念\t1 1.1.1 5V特征\t1 1.1.2 数据类型\t2 1.1.3 大数据平台\t3 1.1.4 大数据的处理流程\t4 1.2 相关技术\t5 1.2.1 数据采集\t5 1.2.2 数据预处理\t6 1.2.3 数据存储\t6 1.2.4 数据挖掘与数据分析\t6 1.2.5 数据可视化\t8 1.3 应用领域\t9 1.4 课后习题\t9 第 2章 Python大数据分析\t10 2.1 Python介绍\t10 2.1.1 Python的应用场景\t10 2.1.2 Python的优点与缺点\t10 2.2 NumPy介绍\t11 2.2.1 NumPy的应用场景\t11 2.2.2 NumPy的数组对象与用法\t11 2.3 pandas介绍\t15 2.3.1 pandas的应用场景\t15 2.3.2 pandas的数据结构与用法\t15 2.4 Matplotlib介绍\t20 2.4.1 Matplotlib库的应用场景\t20 2.4.2 图表绘制\t20 2.5 实践操作\t28 2.6 小结\t33 2.7 课后习题\t33 第3章 Kafka\t34 3.1 Kafka介绍\t34 3.1.1 Kafka的基本架构\t34 3.1.2 Kafka的作用\t36 3.2 Kafka的重要特性\t37 3.2.1 高吞吐\t37 3.2.2 高可用\t38 3.3 安装与配置\t39 3.3.1 ZooKeeper的安装与配置\t39 3.3.2 Kafka的安装与配置\t40 3.4 实践操作\t41 3.5 小结\t44 3.6 课后习题\t44 第4章 数据存储\t45 4.1 HDFS\t45 4.1.1 Hadoop介绍\t45 4.1.2 HDFS介绍\t46 4.1.3 安装与配置\t51 4.1.4 实践操作\t61 4.1.5 小结\t66 4.1.6 课后习题\t66 4.2 HBase\t66 4.2.1 HBase介绍\t66 4.2.2 技术对比\t70 4.2.3 安装与配置\t71 4.2.4 实践操作\t73 4.2.5 小结\t75 4.2.6 课后习题\t76 4.3 Redis\t76 4.3.1 Redis介绍\t76 4.3.2 安装与配置\t80 4.3.3 实践操作\t82 4.3.4 小结\t85 4.3.5 课后习题\t85 第5章 图数据处理\t86 5.1 Neo4j\t86 5.1.1 Neo4j介绍\t86 5.1.2 安装与配置\t89 5.1.3 实践操作\t90 5.1.4 小结\t96 5.1.5 课后习题\t97 5.2 Spark GraphX\t97 5.2.1 图计算基础知识\t97 5.2.2 Spark GraphX介绍\t99 5.2.3 实践操作\t101 5.2.4 小结\t106 5.2.5 课后习题\t106 第6章 离线计算\t107 6.1 MapReduce\t107 6.1.1 MapReduce介绍\t108 6.1.2 安装与配置\t110 6.1.3 实践操作\t112 6.1.4 小结\t133 6.1.5 课后习题\t134 6.2 Spark\t134 6.2.1 Spark介绍\t134 6.2.2 RDD\t138 6.2.3 安装与配置\t143 6.2.4 实践操作\t145 6.2.5 小结\t151 6.2.6 课后习题\t151 第7章 实时计算\t152 7.1 Storm\t152 7.1.1 流计算介绍\t152 7.1.2 Storm介绍\t153 7.1.3 实践操作\t156 7.1.4 小结\t164 7.1.5 课后习题\t164 7.2 Spark Streaming\t165 7.2.1 Spark Streaming介绍\t165 7.2.2 DStream操作\t168 7.2.3 实践操作\t172 7.2.4 小结\t174 7.2.5 课后习题\t175 7.3 Flink\t175 7.3.1 Flink介绍\t175 7.3.2 技术对比\t179 7.3.3 实践操作\t180 7.3.4 小结\t186 7.3.5 课后习题\t186 第8章 OLAP数据分析\t187 8.1 Pig\t187 8.1.1 Pig介绍\t187 8.1.2 Pig Latin语言介绍\t189 8.1.3 Pig的安装与配置\t191 8.1.4 实践操作\t192 8.1.5 小结\t195 8.1.6 课后习题\t196 8.2 Hive\t196 8.2.1 数据仓库介绍\t196 8.2.2 Hive介绍\t197 8.2.3 技术对比\t201 8.2.4 安装与配置\t202 8.2.5 实践操作\t205 8.2.6 小结\t211 8.2.7 课后习题\t211 8.3 Spark SQL\t211 8.3.1 Spark SQL介绍\t211 8.3.2 实践操作\t214 8.3.3 小结\t218 8.3.4 课后习题\t218 第9章 分布式资源管理\t219 9.1 YARN介绍\t219 9.1.1 YARN的基本架构\t220 9.1.2 YARN组件功能\t221 9.1.3 YARN的执行过程\t223 9.2 实践操作\t224 9.3 小结\t230 9.4 课后习题\t230 第 10章 大数据处理架构\t231 10.1 Lambda架构介绍\t231 10.1.1 Lambda的基本结构\t231 10.1.2 优势与不足\t232 10.2 Kappa架构介绍\t233 10.2.1 Kappa的基本结构\t233 10.2.2 优势与不足\t234 10.3 架构对比\t234 10.4 小结\t235 10.5 课后习题\t235 参考文献\t236 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。