内容推荐 近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。 本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、发展和商业应用,数据库与大数据之间的关系,国产数据库的国际化,数据管理系统的共同之处,数据管理系统的算法理论、前沿技术等。 本书适合数据管理系统或大数据方向的技术人员和科研人员阅读,也适合互联网科技公司的技术人员及管理人员,以及对特定领域的商业和历史感兴趣的读者阅读。 作者简介 吴垚,毕业于中国人民大学,是中国人民大学和加利福尼亚大学尔湾分校(UCI)联合培养的博士,目前就职于华为公司加拿大研究院。其国内导师陈红是CCF数据库专委委员,国家科技进步二等奖获得者;国外导师Michael J. Carey是美国工程院院士、ACM和IEEE Fellow。博士在读期间作者参与的项目包括:物联网搜索中的隐私保护研究、新一代高时效安全可靠流数据系统、“Big Active Data:From Petabyte Data to Million People”等。毕业后就职于华为高斯部门,先后在高斯产品部、高斯实验室和多伦多实验室工作,在GaussDB、XY Kernel、HP Kernel等项目中参与AP数据库、AI数据库、TP数据库的研发。
目录 第 1篇 数据管理系统之数据库——掌上明珠 第 1章 数据库的诞生——“图灵”奖经典人物\t3 1.1 网状数据管理系统\t4 1.2 关系数据库模型\t6 1.3 数据库并发与事务\t8 1.4 数据库优化与实践\t10 1.5 小结\t13 1.6 参考资料\t13 第 2章 数据库的工业繁荣——商业机遇\t14 2.1 System R\t14 2.2 PostgreSQL\t16 2.3 Oracle\t18 2.4 MySQL\t20 2.5 IBM Db2\t23 2.6 SQL Server\t27 2.7 小结\t29 2.8 参考资料\t30 第3章 国产数据库的热潮——四大家族\t31 3.1 人大金仓\t31 3.2 南大通用\t32 3.3 武汉达梦\t32 3.4 神舟通用\t33 3.5 小结\t34 3.6 参考资料\t35 第 2篇 数据管理系统之大数据——异军突起 第4章 大数据降临——生逢其时\t39 4.1 Google的“三驾马车”\t39 4.1.1 GFS\t40 4.1.2 MapReduce系统\t41 4.1.3 Bigtable系统\t42 4.2 Amazon的“云上时代”\t43 4.3 Facebook的“社交帝国”\t44 4.4 LinkedIn的“职业摇篮”\t46 4.5 学术界的徘徊辗转\t48 4.6 小结\t49 4.7 参考资料\t49 第5章 大数据分布式系统——高潮迭起\t50 5.1 容错内存迭代式计算\t50 5.2 实时流式大数据计算\t52 5.2.1 Storm系统\t52 5.2.2 Flink系统\t53 5.3 大规模机器学习系统\t54 5.4 数据中心的资源管理\t56 5.5 全球分布式数据服务\t58 5.6 小结\t59 5.7 参考资料\t59 第6章 开源整合架构演进——融会贯通\t60 6.1 链家架构演进\t60 6.1.1 大数据平台架构演进\t60 6.1.2 日志平台设计与技术\t61 6.2 美团架构演进\t62 6.2.1 由浅入深架构解析\t62 6.2.2 基础系统架构演进\t64 6.3 Airbnb架构演进\t65 6.3.1 大数据平台架构解析\t65 6.3.2 平台发展的经验和教训\t66 6.4 58同城架构演进\t68 6.4.1 大数据三层平台架构\t68 6.4.2 关键技术演进与实现\t70 6.5 滴滴出行架构演进\t71 6.5.1 实时计算平台架构演进\t71 6.5.2 实时计算平台架构\t72 6.6 小米架构演进\t73 6.6.1 流式平台整体架构\t73 6.6.2 3个阶段的演进历程\t74 6.7 小结\t77 6.8 参考资料\t77 第7章 大数据的魅力——广泛应用\t78 7.1 工业应用\t78 7.2 银行金融\t79 7.3 智慧城市\t81 7.4 健康医疗\t82 7.5 小结\t83 7.6 参考资料\t84 第3篇 大数据管理系统——谁主沉浮 第8章 数据库与大数据之战——华山论剑\t87 8.1 ACM双方论战\t87 8.2 MPP绝对优势\t89 8.3 大数据强势发展\t91 8.4 数据库自我革命\t94 8.5 NewSQL兼容并包\t96 8.6 老牌数据库的反击\t99 8.7 小结\t101 8.8 参考资料\t102 第9章 大数据管理系统——求同存异\t103 9.1 Hadoop生态\t104 9.2 BDAS平台\t105 9.3 AsterixDB系统\t106 9.4 Apache Beam框架\t108 9.5 SnappyData模型\t109 9.6 SageDB愿景\t110 9.7 ShardingSphere项目\t112 9.8 小结\t114 9.9 参考资料\t115 第 10章 新型数据管理系统——百花齐放\t116 10.1 大数据输入和输出\t116 10.2 大数据调度管控\t119 10.3 大数据用户交互\t123 10.4 大数据安全隐私\t124 10.5 大数据新型引擎\t127 10.6 大数据通用语言\t129 10.7 大数据网络赋能\t130 10.8 小结\t134 10.9 参考资料\t135 第 11章 国产数据库的国际化——齐头并进\t137 11.1 TiDB\t137 11.1.1 研发背景\t137 11.1.2 早期架构\t138 11.1.3 架构升级\t139 11.1.4 稳定架构\t140 11.2 OceanBase\t142 11.2.1 设计考量\t142 11.2.2 架构演进\t144 11.2.3 厚积薄发\t150 11.3 TDSQL\t150 11.3.1 分布式TDSQL \t150 11.3.2 分析型TBase \t152 11.3.3 云原生CynosDB \t153 11.3.4 产品战略统一\t154 11.4 GaussDB\t155 11.4.1 OLTP成长史\t155 11.4.2 OLAP成长史\t156 11.4.3 HTAP成长史\t157 11.4.4 AI-Native成长史\t157 11.5 Bigflow\t158 11.6 ByteGraph\t160 11.7 小结\t163 11.8 参考资料\t164 第4篇 大数据管理系统的架构——路在何方 第 12章 高速电子计算机与大数据管理系统——万法归宗\t167 12.1 以计算为中心的计算机\t167 12.2 以存储为中心的数据机\t170 12.3 大数据管理的系统模型\t172 12.4 数据管理系统的总结抽象\t176 12.5 小结\t178 12.6 参考资料\t179 第 13章 无处不在的操作系统——归纳演绎\t180 13.1 计算机的操作系统\t180 13.2 数据管理系统的操作系统\t184 13.3 数据中心的操作系统\t185 13.4 资源抽象与应用接口\t189 13.5 小结\t192 13.6 参考资料\t192 第 14章 大数据管理系统的未来架构——沙漠绿洲\t194 14.1 大数据操作系统\t195 14.1.1 数据输入\t197 14.1.2 数据存储\t198 14.1.3 数据计算\t200 14.1.4 数据控制\t201 14.1.5 数据输出\t202 14.2 自动化可插拔引擎\t203 14.3 分布式弹性数据模型\t203 14.4 易用抽象作业执行框架\t204 14.5 深度智能系统管理内核\t204 14.6 大数据管理系统biggy原型\t204 14.7 小结\t205 14.8 参考资料\t206 第5篇 大数据管理系统的精髓——无上心法 第 15章 大数据管理系统的基础——算法理论\t209 15.1 存储类算法\t209 15.1.1 大数据LSM的优势\t209 15.1.2 B+-Tree与LSM-Tree对比\t210 15.1.3 LSM的优化算法\t211 15.2 执行器算法\t212 15.2.1 Spark RDD中DAG的应用\t212 15.2.2 分布式数据库的算子运算\t213 15.2.3 大数据DAG与数据库算子的异同\t214 15.3 一致性算法\t214 15.3.1 常见一致性算法简介\t214 15.3.2 Paxos算法进阶深入\t215 15.3.3 一致性的Consensus与Consistency\t216 15.4 持久化算法\t218 15.4.1 经典的WAL\t218 15.4.2 前沿的WBL\t219 15.5 分布式算法\t220 15.5.1 分布式P2P协议\t220 15.5.2 一致性哈希算法\t220 15.6 事务类算法\t222 15.6.1 两阶段提交\t222 15.6.2 三阶段提交\t223 15.7 分布式容错机制\t224 15.7.1 分布式系统容错机制\t225 15.7.2 数据库系统容错机制\t227 15.7.3 工业实践与学术创新\t227 15.8 高并发控制机制\t229 15.8.1 并发控制类别\t229 15.8.2 并发控制实现\t230 15.9 系统健壮性机制\t232 15.10 小结\t234 15.11 参考资料\t234 第 16章 大数据管理系统的前沿——另辟蹊径\t236 16.1 数据上下文管理系统Ground\t236 16.2 自治数据管理系统Peloton\t239 16.3 分布式预测系统Clipper\t240 16.4 数据管理中人的作用CrowdDB\t241 16.5 新硬件带来的变革doppioDB\t242 16.6 端云协同实时数据库Firebase\t243 16.7 自组装数据库XuanYuan\t245 16.8 数据治理新思路Tamr\t248 16.9 系统性能调优AITuning\t249 16.10 小结\t253 16.11 参考资料\t253 第 17章 大数据管理系统的谜团——拨云见日\t255 17.1 分布式机器学习与分布式数据库\t255 17.2 分布式一致性与数据库一致性\t257 17.3 可变的数据与不可变的数据\t260 17.4 区块链与数据库的异同\t261 17.5 NewSQL与OldSQL\t263 17.6 云计算、边缘计算与物联网\t266 17.7 大数据Java还是C/C++\t270 17.8 流数据与批处理的界线\t270 17.9 分布式事务与递增式时间\t272 17.10 小结\t273 17.11 参考资料\t274 第 18章 大数据的标准——游戏规则\t275 18.1 TPC标准测试\t275 18.2 SQL通用语言\t277 18.3 顶级学术会议\t277 18.4 设计范式\t279 18.5 流行趋势\t281 18.6 研究机构\t283 18.7 小结\t284 18.8 参考资料\t284 附录\t285 A.工业与学术\t285 B.国产与国际\t286 C.开放与封闭\t288 D.资本与技术\t292 E.个人与企业\t295 F.过去与未来\t299 G.参考资料\t300
导语 1.内容新颖,结构合理 本书结合大数据和数据库系统,从技术历史的角度介绍数据管理系统的发展,既有系统架构的演进,又有商业产品的兴衰,适合不同的读者。 2.案例丰富,深入浅出 本书有针对性地介绍了如Oracle、IBM、Google等公司数据库和大数据产品的迭代,也介绍了关于Spark、MySQL、TiDB等主流系统的架构设计,同时有对分布式算法、一致性算法等的讲解。从公司、产品、技术、人物等角度列举了诸多实例。 3.配套资源,优化学习 读者可到异步社区网站下载与本书配套的彩图,方便读者提升学习效果
主题词 计算机//数据库//大数据//国产数据库//数据管理系统 |