这不仅是一本从原理到使用、从入门到进阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。
作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 高效使用Greenplum(入门进阶与数据中台) |
分类 | |
作者 | 王春波 |
出版社 | 机械工业出版社 |
下载 | |
简介 | 内容推荐 这不仅是一本从原理到使用、从入门到进阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。 作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。 作者简介 王春波,资深架构师和数据仓库专家,现任上海启高信息科技有限公司大数据架构师,Apache Doris和openGauss贡献者,Greenplum中文社区参与者。 具有十多年的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深入研究,尤其擅长用优雅的SQL实现复杂的逻辑。 常年奔波在各个项目交付现场,曾成功主导过中国邮政储蓄银行、南海农商银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理会计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。 公众号“数据中台研习社”运营者。 目录 序一 序二 序三 前言 第一部分 大数据平台概述 第1章 大数据平台技术的演进 1.1 关系型数据库 1.1.1 数据库发展历程 1.1.2 关系型数据库独霸天下 1.1.3 结构化查询语言SQL 1.1.4 列存储的兴起 1.2 Hadoop生态系统 1.2.1 Hadoop概述 1.2.2 Hadoop生态圈 1.2.3 Hadoop的优缺点 1.3 NoSQL的瓶颈和SQL数据库的回归 1.3.1 NoSQL产品的发展 1.3.2 NoSQL的共性 1.3.3 SQL数据库的回归 1.4 MPP架构的兴起 1.4.1 什么是MPP架构 1.4.2 MPP架构的蓬勃发展 1.4.3 MPP数据库代表——TBase 1.4.4 浅谈HTAP 第二部分 Greenplum入门 第2章 Greenplum概述 2.1 Greenplum的前世今生 2.2 Greenplum数据库架构 2.3 Greenplum数据库的特点 2.4 Greenplum新特性及展望 2.5 Greenplum的优势 第3章 Greenplum的安装与部署 3.1 Greenplum数据库安装过程 3.1.1 准备工作 3.1.2 安装Master节点 3.1.3 复制安装包到其他节点 3.1.4 初始化Greenplum数据库 3.2 安装GPCC 3.3 Greenplum访问接口 3.3.1 CLI 3.3.2 JDBC 3.3.3 ODBC 3.4 Greenplum数据库常用命令 3.4.1 启动和停止 3.4.2 修改参数 3.4.3 其他常用命令 3.5 Greenplum性能测试 第4章 Greenplum使用入门 4.1 数据类型详解 4.1.1 基本数据类型 4.1.2 特殊数据类型 4.1.3 组合数据类型 4.2 数据表的基本使用 4.2.1 表对象定义 4.2.2 表的基本操作 4.2.3 数据的基本操作 4.3 数据表的高级应用 4.3.1 数据表的存储特性 4.3.2 分区表详解 4.3.3 外部表 4.4 数据库函数 4.4.1 数学函数 4.4.2 三角函数列表 4.4.3 字符串函数和操作符 4.4.4 类型转换相关函数 4.4.5 自定义函数 4.5 数据库的其他对象 4.5.1 视图 4.5.2 索引 4.5.3 序列 第三部分 Greenplum应用 第5章 Greenplum查询详解 5.1 SQL语法 5.1.1 简单SQL语法 5.1.2 WITH子句特性 5.1.3 IN语句和EXISTS语句 5.1.4 MERGE子句的实现 5.2 JOIN操作 5.3 分析函数的妙用 5.4 高级函数精选 第6章 ETL工具箱 6.1 数据加载王者GPLoad 6.1.1 GPLoad简介 6.1.2 GPLoad配置详解 6.1.3 GPLoad实战 6.2 自定义存储过程 6.2.1 存储过程介绍 6.2.2 存储过程应用模板 6.2.3 存储过程精选案例 6.3 PXF插件 6.3.1 PXF简介 6.3.2 安装PXF 6.3.3 PXF实战 6.4 DBLink 6.4.1 DBLink简介 6.4.2 安装DBLink 6.4.3 DBlink实战 6.5 拉链表 第7章 Greenplum高级应用 7.1 开放的编程接口 7.1.1 PL/Python 7.1.2 PL/R 7.2 MADlib机器学习库 7.2.1 安装MADlib 7.2.2 线性回归案例 7.2.3 关联规则案例 7.2.4 朴素贝叶斯分类案例 7.3 半结构化数据分析 7.4 地理空间数据分析 7.5 图计算应用 第8章 Greenplum运维管理和监控 8.1 数据库管理 8.1.1 创建和管理数据库 8.1.2 创建和管理模式 8.1.3 创建和管理表空间 8.1.4 创建和管理用户 8.1.5 创建和管理资源队列 8.2 可视化监控页面——GPCC 8.3 管理好帮手——gp_toolkit 8.4 Greenplum备份和恢复 8.5 在线扩容工具GPExpand 8.5.1 Greenplum扩容实战 8.5.2 扩容原理分析 8.6 锁机制 8.6.1 锁管理概述 8.6.2 普通锁数据结构 第9章 Greenplum性能优化 9.1 系统级优化 9.1.1 操作系统选择 9.1.2 硬件资源配置 9.1.3 磁盘读写 9.1.4 节点之间的网络带宽 9.1.5 系统参数 9.2 数据库级优化 9.2.1 数据库参数配置 9.2.2 资源队列 9.3 表级优化 9.3.1 建表参数 9.3.2 表的优化 9.4 执行计划和查询优化 9.4.1 查看执行计划 9.4.2 数据扫描方式 9.4.3 分布式执行方式 9.4.4 两种聚合方式 9.4.5 关联分类 9.4.6 优化器的选择 9.4.7 其他关键术语 第10章 Greenplum与开源组件 10.1 Kettle 10.2 DataX 10.3 HDFS、Hive和HBase 10.4 Spark 10.5 Kafka 10.6 Flink 第11章 Greenplum与BI应用 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。