关于项目管理:这是阿里技术专家对-SRE-和稳定性保障的理解
作者 | 悟鹏起源|阿里巴巴云原生公众号 前言在技术工作中,对于产品/根底技术研发和 SRE 两种角色,通常会有基于「是否偏重编码」的了解。对于产品研发转做 SRE ,常常会产生是否要「脱离编码工作」的认识,或者认为是否要「偏离对产品/根底技术的推动」。 基于过往的技术研发和稳定性保障的教训,分享下集体对 SRE 的了解,探讨「面向产品/根底技术的研发」和「稳定性保障」两种角色之间的协作关系,更好地为业务服务。 SRE 概述最早探讨 SRE 来源于 Google 这本书《Site Reliability Engineering: How Google Runs Production Systems》。由 Google SRE 要害成员分享他们是如何对软件进行生命周期的整体性关注,以及为什么这样做可能帮忙 Google 胜利地构建、部署、监控和运维世界上现存最大的软件系统。 书的豆瓣链接:https://book.douban.com/subject/26875239/ 最早探讨 SRE 来源于 Google 这本书《Site Reliability Engineering: How Google Runs Production Systems》。由 Google SRE 要害成员分享他们是如何对软件进行生命周期的整体性关注,以及为什么这样做可能帮忙 Google 胜利地构建、部署、监控和运维世界上现存最大的软件系统。 Site reliability engineering (SRE) is a discipline that incorporates aspects of software engineering and applies them to infrastructure and operations problems. The main goals are to create scalable and highly reliable software systems.其中有句形象形容 SRE 工作的形容: ...