# 一分钟精华速览 #混沌工程作为一种提高技术架构弹性能力和容错能力的复杂技术手段,近年来讨论声音不断,相比在分布式系统上进行随机的故障注入实验,基于混沌工程的大规模自动化故障演练,不仅能将“作战演习”常态化,还能通过提高覆盖面而获得更高的产出价值,帮助更全面地完善故障应急预案和处理体系。此前 TakinTalks 分享了去哪儿在过去 3 年里 4 个阶段的混沌工程能力建设(破坏系统是为了更稳
# 一分钟精华速览 #混沌工程是在分布式系统上进行实验,在整个系统中随机位置通过工具引发故障,从而提高系统健壮性以及人员的响应效率,建立对系统抵御生产环境中失控条件的能力以及信心的手段。虽然混沌工程已经发展了十余年,但对大部分公司和研发团队,它仍是一个比较陌生的领域。本文总结了去哪儿 2019 年至今,从零开始建设混沌工程平台的 4 个阶段,以及各阶段的落地成果,整体建设思路和落地路线极具参考性。
活动时间: 2022年7月16日,14:00-17:00活动地点:线上直播(infoQ视频号线上直播、B站直播间)故障专题 “程序员不能被同一原因的故障坑两次”——程序员的自我修养 移动互联网时代,业务场景多元、玩法多样瞬时流量高,系统的复杂度也越来越高。一次故障就是一次考试。不管你是研发、测试、运维,或其他“工种”,只要你身处IT行业,「故障」怕都是大家避之唯恐不及却无法绕开的一个
在保障超5.3亿注册用户体验和系统稳定性过程中,是如何通过系统的、
# 一分钟精华速览 #故障复盘指的是及时把过去发生的错误,最大程度转化为未来可以规避的办法,其核心是不断减少失败因子繁衍的温床,将它们牢牢地掌控在不至于引发危机的范围之中。作为国民基础设施的哈啰出行,在保障超 5.3 亿注册用户体验和系统稳定性过程中,是如何通过系统的、有策略的总结复盘来避免故障重复发生的?作者介绍哈啰技术风险负责人——孟闯 十年互联网行业研发经验,2015 年加入哈啰出
# 一分钟精华速览 #混沌工程作为一种提高技术架构弹性能力和容错能力的复杂技术手段,近年来讨论声音不断,相比在分布式系统上进行随机的故障注入实验,基于混沌工程的大规模自动化故障演练,不仅能将“作战演习”常态化,还能通过提高覆盖面而获得更高的产出价值,帮助更全面地完善故障应急预案和处理体系。 此前TakinTalks分享了去哪儿在过去3年里4个阶段的混沌工程
一分钟精华速览在研发和稳定性保障过程中,人与设备、程序、组织的交互是一个复杂的过程,虽然人们极少会恶意犯错,但由于受特定情景下的实际条件影响,人为失误也时有发生,那么,如何尽可能减少这些失误的发生?如何保障研发质量和系统稳定?「TakinTalks 论道系列」12 月刊第三期,即将发布,敬请期待!当我们把人有可能犯错的地方,通过代码、工具或者数据实现强有效的管控,就能做到不让人为因素随意破坏系统的
一分钟精华速览本篇内容来源于 TakinTalks 稳定性社区「年度专家小会·杭州站」,感谢阿里、腾讯云、飞书、网易、华为、浙江移动、极氪、酷家乐、大搜车、二维火、亲宝宝等等企业 20 余位稳定性专家的积极贡献,为我们多角度呈现了不同业务、不同规模、不同团队下的优秀管理和实践经验。「TakinTalks 论道系列」12 月刊第二期,即将发布,敬请期待!作为技术管理者,在从技术角色到管理角色的转变中
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号