![]()
内容推荐 本书兼顾深度和广度、应用和原理、研发和运维,系统介绍各类大数据计算系统。本书内容分为四个部分,包括大数据计算系统的基础知识、大数据计算系统的配置与编程方法、大数据计算系统的原理,以及大数据计算系统的监控、运维与调优。 本书内容全面,体系清晰,可作为高校大数据及相关专业的课程教材,也可以作为从事大数据计算系统应用开发工作的技术人员的参考书。 作者简介 王宏志,哈尔滨工业大学计算机科学与技术学院副教授、博士生导师。研究方向包括大数据管理、数据质量、图数据管理。发表学术论文140余篇,出版学术专著两本,参与翻译《算法导论(第3版)》。在爱课程网、学堂在线、好大学在线上首次开设“大数据算法”在线课程,出版《大数据算法》教材。 目录 前言 第一部分 基础 第1章 大数据计算系统概述 1.1 大数据计算系统的定义 1.1.1 大数据 1.1.2 大数据计算 1.1.3 大数据计算系统 1.2 常见的大数据计算系统 1.2.1 批处理计算框架Hadoop 1.2.2 分布式计算框架Spark 1.2.3 流计算系统Stom 1.2.4 分布式图计算框架GraphX 1.2.5 大数据计算系统的对比 1.3 大数据计算系统的监控与运维概述 1.3.1 概述 1.3.2 监控与运维的范围 1.3.3 大数据计算系统的监控与运维方法 1.3.4 大数据计算系统的运维目标 1.4 大数据计算系统的性能优化 1.4.1 提升大数据计算系统性能的途径 1.4.2 提升大数据计算系统性能的难度 1.4.3 运维与性能优化的关系 习题1 第二部分 应用实现 第2章 Hadoop的配置与编程 2.1 批处理计算框架概述 2.1.1 计算框架 2.1.2 批处理 2.2 Hadoop环境的配置与搭建 2.2.1 环境配置前的准备 2.2.2 Hadoop安装的预备知识 2.2.3 本地/独立模式的配置 2.2.4 伪分布式模式的配置 2.2.5 全分布式模式的配置 2.3 一个简单示例 2.3.1 环境与数据的准备 2.3.2 在IDEA下建立基于Maven的Hadoop项目 2.3.3 编写WordCount程序 2.3.4 Hadoop程序的运行过程与结果查看 2.4 MapReduce编程 2.4.1 MapReduce计算模型 2.4.2 MapReduce程序的运行过程 2.4.3 去重 习题2 第3章 HDFS及其应用 3.1 HDFS概述 …… 第三部分 原理 第四部分 监控、运维与调优 |