![]()
内容推荐 本书的主要内容包括:Spark大数据编程环境、Spark 工作机制、Spark SQL编程、SparkStreaming流式编程、Spark Graphx 图编程等。已有Spark大数据编程类书籍以讲解概念为主,本书将首次将Spark大数据真正落到实处,提供一个个具体的编程实例,全部由作者动手调试成功,并随书附送。除了通用的Spark编程,本书还结合数据仓库、流式计算、图计算、机器学习讲解最新的编程技术,既站在大数据编程的最前沿,有具有很好可操作性。 目录 第1章 Spark概述 1.1 Spark的背景 1.1.1 Spark发展史 1.1.2 Spark的特点 1.2 Spark生态系统 1.2.1 Spark Core 1.2.2 Spark SQL 1.2.3 Spark Streaming 1.2.4 GraphX 1.2.5 MLBase/MLlib 1.2.6 SparkR 1.3 Spark运行架构 1.3.1 相关术语 1.3.2 Spark架构 1.3.3 执行步骤 1.3.4 Spark运行模式 1.4 WordCount示例 1.4.1 三种编程语言的示例程序 1.4.2 Scala版本WordCount运行分析 1.4.3 WordCount中的类调用关系 1.5 本章小结 思考与习题 第2章 搭建Spark开发环境 2.1 Spark开发环境所需软件 2.2 安装Spark 2.2.1 spark-sheU下的实例 2.2.2 SparkWEB的使用 2.3 IDEA 2.3.1 安装IDEA 2.3.2 IDEA的实例(Scala) 2.3.3 IDEA打包运行 2.4 Eclipse 2.4.1 安装Eclipse 2.4.2 Eclipse的实例(Scala) 2.5 本章小结 思考与习题 第3章 Scala语言基础 3.1 Scala简介 3.1.1 Scala特点 3.1.2 Scala运行方式 3.2 变量与类型 3.2.1 变量的定义与使用 3.2.2 基本数据类型和操作 3.2.3 Range操作 3.3 程序控制结构 3.3.1 if条件表达式 3.3.2 循环表达式 3.3.3 匹配表达式 3.4 集合 3.4.1 数组 3.4.2 列袁 3.4.3 集 3.4.4 映射 3.4.5 Option 3.4.6 迭代器与元组 3.5 函数式编程 3.5.1 函数 3.5.2 占位符语法 3.5.3 递归函数 …… 第4章 Scala面向对象编程 第5章 RDD编程 第6章 Spark SQL 第7章 Spark Streaming 第8章 Spark GraphX 第9章 Spark机器学习原理 第10章 Spark机器学习模型 参考文献
|