传统的开发流程中,工程师负责具体功能开发,稳定性则由运维人员负责,这种相对独立的关系,使得团队之间沟通错位,软件的开发、测试、上线、维护也变得更加不可靠。
为了让业务交付流程化、统一化,减少工程师与运维人员之间的隔阂,Google 发明了 SRE。
SRE 全称 Site Reliability Engineering,也称系统可靠性工程,具有高扩展性和高可用性,是 DevOps 的一种工程实现,在 Google 践行时间超过 15 年。借助成熟的 SRE 实践,开发与运维人员可以更顺畅高效地沟通、测试和发布互联网应用软件。并且可以回答困扰 IT 管理人员的两个问题:
- 系统的可靠性是否能经受住考验?
- 如何更好的维护发布新版本和系统可靠性之间的平衡
参加本次由 Google Cloud 举办的线上分享活动,您将了解到:
l 深入浅出认识 SRE
l SRE 的基础组件构成
l SRE 对组织、流程和工具的调整