![]()
内容推荐 本书主要包括云计算和大数据简介、虚拟化技术、分布式大数据系统Hadoop、分布式应用程序协调服务ZooKeeper、分布式计算框架MapReduce、分布式数据库HBase、数据仓库Hive、数据迁移工具Sdoop、实时数据处理Spark。 本书可作为高等院校的大数据、云计算、人工智能及计算机相关专业的教材和参考书,也可作为大数据爱好者的学习用书和自学参考书。 目录 项目一 云计算和大数据简介 任务1 云计算简介 任务2 大数据简介 任务3 云计算与大数据的发展趋势 项目小结 练习一 项目二 虚拟化技术 任务l 虚拟化技术简介 任务2 常见虚拟化软件 任务3 实训任务VMware Workstation安装和使用 任务4 实训任务Linux虚拟机的安装 任务5 常见终端模拟访问程序 任务6 实训任务Xshell安装和使用 项目小结 练习二 项目三 分布式大数据系统Hadoop 任务1 Hadoop简介 任务2 Hadoop生态系统 任务3 HDFs 任务4 实训任务Hadoop环境搭建与安装 任务5 实训任务Hadoop shell常见命令的使用 项目小结 练习三 项目四 分布式应用程序协调服务zookeeper 任务1 Zookeeper简介 任务2 Zookeeper的工作原理 任务3 实训任务Zookeeper安装与配置 项目小结 练习四 项目五 分布式计算框架MapRedace 任务1 MapReduce简介 任务2 MapReduce的基本工作过程 任务3 实训任务MapReduce API—WordCount实现 项目小结 练习五 项目六 分布式数据库HBase 任务1 HBase简介 任务2 HBase系统架构 任务3 HBase表视图 任务4 实训任务HBasej的搭建与使用 任务5 实训任务HBase shell常见命令的使用 任务6 实训任务HBase API 任务7 NoSQL数据库 项目小结 练习六 项目七 数据仓库Hive 任务l Hive简介 任务2 Hive系统架构 任务3 Hive存储和压缩 任务4 实训任务Hive的搭建与使用 任务5 实训任务Hive shell常见命令的使用 任务6 实训任务Hive API 项目小结 练习七 项目八 数据迁移工具Sqoop 任务1 Sqoop简介 任务2 实训任务Sqoop的安装与配置 任务3 实训任务Sqoop操作 任务4 Hive和Sqoop的关系 项目小结 练习八 项目九 实时数据处理spark 任务1 Spark简介 任务2 Spark组成结构 任务3 Spark运行架构 任务4 实训任务Spark的安装与配置 任务5 实训任务Spark shell命令的使用 项目小结 练习九 附录 Hadoop2.x常用端口及查看方法 参考文献 |