内容推荐 本书系统地讲解了大数据查询技术涉及的知识体系,主要是Hadoop生态圈体系中的各个组件,包括HDFS、Hive、Presto、HBase、Phoenix、Elasticsearch和dbeaver。 本书采用项目任务驱动的方式进行讲解,覆盖组件的工作原理、部署安装和使用方法,力求用简洁明了的语言帮助读者更有效地动手实践。 本书适合作为高等院校本科生、研究生的大数据及其相关课程的教材,也可以作为相关研究人员和工程技术人员的参考资料。 目录 项目一 企业人力资源数据的分析与处理 [引导案例] 任务一 大数据存储技术基础 [职业能力目标] [任务描述与要求] [知识储备] 一、什么是大数据 二、大数据存储的理论基础 三、Hadoop生态圈与平台架构 [任务实施] [任务检查与评价] [任务小结] [任务拓展] 任务二 分布式文件系统HDFS [职业能力目标] [任务描述与要求] [知识储备] 一、HDFS的体系架构详解 二、使用不同的方式操作HDFS 三、HDFS的高级特性 四、HDFS的底层通信方式RPC [任务实施] [任务检查与评价] [任务小结] [任务拓展] 任务三 数据仓库Hive [职业能力目标] [任务描述与要求] [知识储备] 一、Hive简介 二、安装部署Hive 三、Hive的数据模型 四、Hive的内置函数 五、Hive的自定义函数 六、Hive的JDBC客户端 [任务实施] [任务检查与评价] [任务小结] [任务拓展] 任务四 使用Presto查询数据 [职业能力目标] [任务描述与要求] [知识储备] 一、Presto基础知识 二、使用Presto处理数据 三、Presto的JDBC客户端 [任务实施] [任务检查与评价] [任务小结] [任务拓展] 任务五 使用DBeaver进行Hive数据的可视化查询 [职业能力目标] [任务描述与要求] [知识储备] [任务实施] [任务检查与评价] [任务小结] [任务拓展] 项目二 电商平台订单数据的分析与处理 [引导案例] 任务一 列式数据库HBase [职业能力目标] [任务描述与要求] [知识储备] 一、HBase的体系架构 二、部署HBase 三、使用命令行操作HBase 四、HBase的Java API 五、使用HBase Web Console 六、深入HBase的存储结构 七、HBase读数据流程 八、HBase写数据流程 九、Region的管理 十、HBase的内存刷新策略 十一、深入HBase RowKey 十二、使用Bulk Loading导入数据 [任务实施] [任务检查与评价] [任务小结] [任务拓展] 一、使用多版本保存数据 二、使用HBase的快照 三、HBase的访问控制 四、备份HBase的数据 五、HBase的计数器 六、布隆过滤器 七、HBase的主从复制 任务二 使用Phoenix查询数据 [职业能力目标] [任务描述与要求] 知识储备] 一、Phoenix简介 二、安装和使用Phoenix 三、Phoenix与HBase的映射关系 四、Phoenix中的索引 五、在Phoenix中执行JDBC [任务实施] [任务检查与评价] [任务小结] [任务拓展] 任务三 Elasticsearch [职业能力目标] [任务描述与要求] [知识储备] 一、Elasticsearch简介 二、Elasticsearch与关系型数据库的 三、Elasticsearch的节点 四、Elasticsearch中的核心概念 五、安装Elasticsearch [任务实施] [任务检查与评价] [任务小结] [任务拓展] 参考文献 |