![]()
内容推荐 本书以Scala作为开发Spark应用程序的编程语言,系统地介绍了Spark编程的基础知识。全书共9章,内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、Spark SQL、Spark Streaming、Structured Streaming和Spark MLlib。 本书每章都安排了入门级的编程实践操作,以便使读者能更好地学习和更牢固地掌握Spark编程方法。本书配套官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、授课视频、上机实验指南等。 本书可以作为高等院校计算机、软件工程、数据科学与大数据技术等专业的进阶级大数据课程教材,用于指导Spark编程实践,也可供相关技术人员参考。 目录 第1章 大数据技术概述 1.1 大数据的概念与关键技术 1.1.1 大数据的概念 1.1.2 大数据关键技术 1.2 代表性大数据技术 1.2.1 Hadoop 1.2.2 Spark 1.2.3 Flink 1.2.4 Beam 1.3 编程语言的选择 1.3.1 不同编程语言简介 1.3.2 Spark开发语言对比 1.4 在线资源 1.5 本章小结 1.6 习题 实验1 Linux系统的安装和常用命令 第2章 Scala语言基础 2.1 Scala语言概述 2.1.1 计算机的缘起 2.1.2 编程范式 2.1.3 Scala简介 2.1.4 Scala的安装 2.1.5 HelloWorld 2.2 Scala基础知识 2.2.1 基本数据类型和变量 2.2.2 I/O 2.2.3 控制结构 2.2.4 数据结构 2.3 面向对象编程基础 2.3.1 类 2.3.2 对象 2.3.3 继承 2.3.4 参数化类型 2.3.5 特质 2.3.6 模式匹配 2.3.7 包 2.4 函数式编程基础 2.4.1 函数的定义与使用 2.4.2 高阶函数 2.4.3 闭包 2.4.4 偏应用函数和Curry化 2.4.5 针对容器的操作 2.4.6 函数式编程实例 2.5 本章小结 2.6 习题 实验2 Scala编程初级实践 第3章 Spark的设计与运行原理 3.1 概述 3.2 Spark生态系统 3.3 Spark运行架构 3.3.1 基本概念 3.3.2 架构设计 3.3.3 Spark运行基本流程 3.3.4 RDD的设计与运行原理 3.4 Spark的部署方式 3.5 TensorFlowOnSpark 3.6 本章小结 3.7 习题 第4章 Spark环境搭建和使用方法 4.1 安装Spark 4.1.1 基础环境 4.1.2 下载安装文件 …… 第5章 RDD编程 第6章 Spark SQL 第7章 Spark Streaming 第8章 Structured Streaming 第9章 Spark MLlib |