![]()
内容推荐 本书包括9个模块,分别为部署数据仓库环境、创建数据仓库文件、管理仓库表中的数据、管理分区表中的数据、分析和导出仓库数据、应用函数统计分析、迁移平台数据方法、调优数据仓库性能、数据仓库应用实战。编者秉持“以提升学生能力为本”的编写理念,基于工作过程导向重构课程体系,采用情景导入式和问题导入式教学模式,联合企业遴选4个不同应用场景的大数据分析项目,设计24个循序渐进的任务,按照“学习目标→任务分析→技术准备→任务实施→任务小结→模块总结→实践创新→检测反馈”结构编写,引导学生“照样做”“模仿做”“独立做”“创新做”。 本书既可作为高校大数据及相关专业的教材,又可作为培训机构的教学用书,还可作为大数据技术行业技术人员的参考用书。 目录 项目模块1 部署数据仓库环境 任务1.1 部署Hive系统 1.1.1 Hive的系统架构 1.1.2 Hive的工作原理 1.1.3 Hive和传统数据库的区别 1.1.4 检查及配置Hadoop 1.1.5 安装和配置Hive 1.1.6 配置MySQL存储Hive元数据 任务1.2 作Hive CLI 1.2.1 Hive CLI的自动补全功能 1.2.2 Hive CLI中命令的格式 1.2.3 在Hive CLI中执行Hadoop的dfs命令 1.2.4 Hive CLI中的变量和属性 1.2.5 使用Hive中的-e(一次使用)命令 1.2.6 使用Hive中的-f命令执行脚本 1.2.7 设置.hiverc默认配置文件 1.2.8 查看作命令历史 模块总结 实践创新 检测反馈 项目模块2 创建数据仓库文件 任务2.1 创建数据仓库 2.1.1 数据仓库分层 2.1.2 数据仓库文件的存储路径 2.1.3 数据仓库的创建 2.1.4 设计“大数据商业智能选址”项目的数据仓库 2.1.5 创建“大数据商业智能选址”项目运营层数据仓库 2.1.6 创建“大数据商业智能选址”项目仓库层数据仓库 任务2.2 查询和管理数据仓库 2.2.1 数据仓库的查询 2.2.2 数据仓库的切换 2.2.3 数据仓库的查看 2.2.4 数据仓库的存储位置 2.2.5 查询“大数据商业智能选址”项目的数据仓库的列表 2.2.6 查询“大数据商业智能选址”项目的数据仓库的详细信息 任务2.3 修改和删除数据仓库 2.3.1 数据仓库的修改 2.3.2 数据仓库的删除 2.3.3 修改“大数据商业智能选址”项目运营层数据仓库的属性 2.3.4 修改“大数据商业智能选址”项目仓库层数据仓库的属性 2.3.5 删除coursedb数据仓库 模块总结 实践创新 检测反馈 项目模块3 管理仓库表中的数据 任务3.1 创建数据表 3.1.1 Hive中的数据类型 3.1.2 表的创建 3.1.3 表的管理 3.1.4 其他创建表的方式 3.1.5 数据表属性 3.1.6 数据表存储格式 3.1.7 构建“大数据商业智能选址”项目的逻辑模型 3.1.8 创建“大数据商业智能选址”项目的ods_site数据仓库的非分区表 3.1.9 创建“大数据商业智能选址”项目的dwd_site数据仓库中的表 …… 项目模块4 管理分区表中的数据 项目模块5 分析和导出仓库数据 项目模块6 应用函数统计分析 项目模块7 迁移平台数据方法 项目模块8 调优数据仓库性能 项目模块9 数据仓库应用实战 附录A “大数据智慧旅游”产品的背景 附录B “大数据智慧旅游”项目的背景 附录C “大数据智慧旅游”项目的数据处理流程 附录D “大数据智慧旅游”项目的逻辑模型设计 |