内容推荐 《进化(运维技术变革与实践探索)》依托作者赵成在电信和互联网行业多年的从业经历,结合一线工作实践,从应用生命周期的视角,全面详细地介绍了分布式架构体系下,应用运维体系建设的方方面面,涵盖了体系建设方法论指导、持续交付体系建设思路和实践、稳定性体系规划建设,以及故障的科学管理方法等内容,视角新颖且独特,旨在通过换一个角度看运维,带给读者不一样的思考方式。 本书是各行业运维工程师和运维架构师了解新时代运维趋势必不可少的学习材料,同时也是业务架构师,开发、测试等技术人员以及技术经理、总监等管理人员用来丰富技术视角不可多得的宝贵参考书。 作者简介 赵成,是公众号“Forrest随想录”的作者,多届ArchSummit运维专题明星讲师和优秀出品人,TGO杭州分会会员。目前专注于云计算和人工智能时代的运维转型和提升。 加入蘑菇街之前,赵成在华为工作了七年,经历过开发、测试、运维以及一线客户服务等诸多岗位。他在不断的历练中迅速成长,培养了全面思考的意识和能力,积累了丰富的电信级和互联网业务研发及运维经验。 赵成说他踏上运维之路有很大的偶然性,一,不忍心看着自己跟团队开发出来的系统到了线上总是出问题,所以每当有问题时,他总是冲在前面解决问题,久而久之,便积累了丰富的经验,也成为团队中比较重要的角色;第二,也是更重要的一个因素,他说自己非常享受那种攻克难题之后的成就感。 目录 第1章 运维的本质 1.1 顶级公司的运维定义 1.1.1 没有运维的Netflix 1.1.2 Netflix是如何成为行业典范的 1.1.3 总结 1.2 运维体系建设的核心概念:应用 1.2.1 应用的起源 1.2.2 应用模型及关系模型的建立 1.2.3 微服务架构时代下为什么要以应用为核心 第2章 运维体系建设 2.1 标准化体系建设基础 2.1.1 标准化的原因和步骤 2.1.2 基础设施层面的标准化 2.1.3 应用层面的标准化 2.1.4 总结 2.2 标准化体系建设实践:基础架构标准化 2.2.1 常见的分布式基础架构组件 2.2.2 基础架构组件的选型问题 2.2.3 基础架构的服务化 2.2.4 运维的职责 第3章 配置管理数据库(CMDB) 3.1 CMDB的前世今生 3.1.1 CMDB源起 3.1.2 传统运维思路下的CMDB 3.1.3 互联网运维体系下的CMDB 3.1.4 CMDB进行时 3.2 有了CMDB,为什么还需要应用配置管理 3.2.1 CMDB是面向资源的管理,是运维的基石 3.2.2 应用配置管理是面向应用的管理,是运维的核心 3.2.3 总结 3.3 在CMDB中落地应用的概念 3.3.1 如何有效组织和管理应用 3.3.2 应用的集群服务分组建设 3.3.3 CMDB在基础服务体系中的核心位置 3.3.4 总结 第4章 运维组织架构及模式 4.1 运维组织架构和转型 4.1.1 自助化运维能力的建设 4.1.2 从价值呈现的角度看运维 4.1.3 运维协作模式的改变 4.1.4 运维的组织架构 4.1.5 总结 4.2 Google SRE的运维模式 4.2.1 SRE岗位的定位 4.2.2 SRE岗位的职责 4.2.3 如何借鉴和落地 4.3 从Google CRE谈运维的服务意识 4.3.1 CRE产生的背景 4.3.2 CRE岗位的职责 4.3.3 从CRE谈谈做运维为什么要有服务心态 4.4 云计算和AI时代下的运维转型 4.4.1 应用运维的转型 4.4.2 云计算和AI带给我们的挑战 4.4.3 总结 第5章 持续交付 5.1 提升效率,为什么要先做持续交付 5.1.1 什么是持续交付 5.1.2 持续交付的关键点 5.2 持续交付的第一关键点:配置管理 5.2.1 版本控制 5.2.2 依赖管理 5.2.3 软件配置 5.3 多环境配置管理 5.3.1 多环境问题 5.3.2 不同环境下的应用配置管理 5.3.3 环境配置管理解决方案 5.3.4 总结 5.4 多环境建设 5.4.1 环境分类 5.4.2 线下环境分类建设 5.4.3 环境建设上的关键技术点 5.4.4 总结 5.5 线上环境建设 5.5.1 生产环境 5.5.2 Beta环境 5.5.3 预发环境 5.5.4 办公网生产环境 5.5.5 总结 5.6 流水线模式 5.6.1 持续交付流水线简要说明 5.6.2 项目需求分解 5.6.3 提交阶段之开发模式选择 5.6.4 开发模式的选型原则 5.7 流水线软件构建 5.7.1 构建环节 5.7.2 几个关键问题 5.8 流水线构建完成后的质量保障 5.8.1 依赖规则限制 5.8.2 功能测试 5.8.3 非功能测试 5.8.4 总结 5.9 持续交付实践:根据业务场景找方案 5.9.1 软件的持续部署发布 5.9.2 发布策略 5.9.3 持续交付体系的收益 5.9.4 总结 第6章 稳定性保障 6.1 极端业务场景下的稳定性保障 6.1.1 我们所面对的极端业务场景 6.1.2 技术上的挑战 6.1.3 极端业务场景下的不确定因素 6.2 稳定性实践 6.2.1 容量规划 6.2.2 限流降级 6.2.3 开关和预案 6.2.4 全链路跟踪系统 第7章 故障管理 7.1 我对故障的理解 7.2 故障定级和定责 7.2.1 故障的定级标准 7.2.2 故障的定责标准 7.3 故障定责的目的 7.3.1 关于定责和处罚 7.3.2 目的是鼓励做事,而不是处罚错误 7.3.3 处罚的“负”作用远超我们的想象 7.4 故障应急和故障复盘 7.4.1 故障应急 7.4.2 故障复盘 7.4.3 定期总结故障案例 7.4.4 总结 第8章 云运维的技术选型 8.1 为什么蘑菇街会选择上云 8.1.1 我们所面临的问题 8.1.2 纵观技术发展趋势 8.1.3 没有银弹 8.2 为什么混合云是未来云计算的主流形态 8.2.1 关于混合云 8.2.2 我们所经历的几个基础设施建设阶段 8.2.3 总结 8.3 面向应用层的云架构解决方案:Spring Cloud 8.3.1 Spring Cloud框架中云的影子 8.3.2 CNCF 8.3.3 可以预见的技术发展趋势 8.4 云计算时代的弹性伸缩 8.4.1 弹性伸缩的主体是谁 8.4.2 总结 第9章 CDN 9.1 从CDN和云存储来聊聊云生态的崛起 9.1.1 CDN和云存储 9.1.2 云生态的优势 9.1.3 总结 9.2 页面静态化架构和二级CDN建设 9.2.1 静态化架构建设的业务场景 9.2.2 页面静态化架构 9.2.3 静态化架构在大促场景中的应用 9.2.4 二级CDN建设 9.2.5 总结 第10章 运维 导语 《进化(运维技术变革与实践探索)》是一线运维大咖赵成十多年的运维经验总结,带你避开运维路上的那些“坑”; 从大公司的案例看运维,直击运维本质,换个角度看运维; 从应用运维体系建设到效率和稳定性实践,理论结合实践,全面解读运维体系建设; 云计算和人工智能时代,该如何做好运维的转型和提升,运维人员该何去何从。 |