![]()
内容推荐 刘彬斌主编的《Hadoop+Spark大数据技术(微课版)/大数据与人工智能技术丛书》从初学者角度出发,通过丰富的实例,详细介绍了大数据开发环境和基本知识点的应用。全书内容包括:大数据系统基础篇、Hadoop技术篇、Spark技术篇和项目实战篇。大数据系统基础篇讲解Linux的安装、Linux的使用和在Linux系统上安装并使用MySQL;Hadoop技术篇讲解Hadoop集群的搭建、Hadoop两大核心的原理与使用、Hadoop生态圈的工具原理与使用(Hive、HBase、Sqoop、Flume等);Spark技术篇讲解Spark集群的搭建、Scala语言、RRD、Spark SQL、Spark streaming和机器学习;项目实战篇将真实的电力能源大数据分析项目作为实战解读,帮助初学者快速入门。 本书所有知识点都结合具体实例和程序讲解,便于读者理解和掌握。本书适合作为高等院校计算机应用、大数据技术及相关专业的教材;也适合作为大数据开发入门者的自学用书,可快速提高开发技能。 目录 第1篇 大数据系统基础 第1章 大数据概述 1.1 数据的产生与发展 1.2 大数据的基础知识 1.3 大数据架构 第2章 系统的安装与使用 2.1 系统安装 2.1.1 安装CentOS 6.x 2.1.2 安装步骤 2.2 基本命令 2.2.1 cd命令 2.2.2 打包和解压指令 2.2.3 其他常用命令 2.3 权限与目录 2.3.1 权限 2.3.2 目录 2.4 文件操作 2.4.1 文件与目录管理 2.4.2 用户和用户组管理 2.5 习题与思考 第3章 任务命令 3.1 脚本配置 3.1.1 Shell脚本 3.1.2 Shell变量 3.1.3 Shell传递参数 3.1.4 Shell数组 3.1.5 Shell运算符 3.1.6 Shell echo命令 3.1.7 Shell printf命令 3.1.8 Shell test命令 3.1.9 Shell流程控制 3.2 网络配置 3.3 习题与思考 第4章 数据库操作 4.1 数据库简介 4.1.1 MySQL数据库简介 4.1.2 安装MySQL 4.2 数据库基本操作 4.2.1 MySQL的DDL操作 4.2.2 MySQL的DML操作 4.3 数据库用户操作 4.3.1 创建用户 4.3.2 给用户授权 4.3.3 撤销授权 4.3.4 查看用户权限 4.3.5 删除用户 4.3.6 修改用户密码 4.4 数据库查询操作 4.5 习题与思考 第2篇 Hadoop技术 第5章 Hadoop开发环境 5.1 Hadoop生态圈工具 5.2 环境搭建 5.2.1 步骤1——虚拟机安装 5.2.2 步骤2——安装JDK和Hadoop 5.2.3 步骤3——复制虚拟机 5.2.4 步骤4——设置免密 5.2.5 步骤5——安装Zookeeper 5.2.6 步骤6——启动Hadoop集群 5.2.7 正常启动顺序 5.3 常见问题汇总 5.4 习题与思考 第6章 HDFS技术 6.1 HDFS架构 …… 第7章 MapReduce技术 第8章 Hive数据仓库 第9章 HBase分布式数据库 第10章 Sqoop工具 第11章 Flume日志收集 第3篇 Spark技术 第12章 Spark概述 第13章 Scala语言 第14章 Spark高可用环境 第15章 RDD技术 第16章 Spark SQL 第17章 Spark Streaming 第18章 Spark机器学习 第4篇 项目实战 第19章 基于电力能源的大数据实战
|