关于人工智能:半年内36个App崩了的热搜是时候聊聊混沌工程的探索与实践了

30次阅读

共计 1090 个字符,预计需要花费 3 分钟才能阅读完成。

叮铃铃~ 程序员小陈的电话响了,刚进入梦乡的他睡眼朦胧的在光明中摸出手机,“喂 …… 哪位 ……”

“最近降级的 2.3.7 版本,又呈现了 bug,客户在问了,尽快解决下!”

“好 …… 这就去 ……”

加班修 Bug 已成为小陈的粗茶淡饭。查验问题,解决故障,复原服务 …… 预计前半夜又没得睡了。这样的经验,作为程序员的你肯定也并不生疏。

近年来,云原生架构的广泛应用及微服务的遍及令开发的便捷性大幅晋升,随之而来,简单的分布式服务体系中,故障产生的随机性和不可测试性也大大提高。微博上时常能看到各大 APP 崩了的热搜。据知微舆论场统计,往年上半年这样的微博热搜共呈现了 36 次。

零碎越简单,越软弱。在简单式散布零碎中,任何渺小的变更,都可能诱发蝴蝶效应,导致大面积的零碎瘫痪,从而让企业接受昂扬的损失。如何能提前探知和解决潜在的零碎危险,升高故障产生的概率,真正实现云上韧性架构?

混沌工程正是这样一门新兴的技术学科。自 Netflix 在亚马逊云科技上公布了一款名叫 Chaos monkey 的服务,可帮忙工程师疾速理解他们正在构建的服务是否强壮并有足够弹性,混沌工程开始衰亡。目前,国内外的多家大型互联网公司都采纳某种模式的混沌工程来进步古代架构的可靠性。多年来,亚马逊在该畛域一直摸索,并于往年发表推出本人的混沌工程服务 – Amazon FIS (Fault Injection Simulator)。

越来越多的开发者们开始在这一畛域开展更多摸索。9 月 15 日 Tech Talk 将从亚马逊云科技在混沌工程的摸索与实际登程,深度分析企业实际混沌工程的常见难点,以及如何借助 Amazon FIS 服务落地混沌工程。

                        
                                        ** 本期主题 **

亚马逊云科技在混沌工程的摸索与实际

                                        ** 讲师介绍 **

黄帅,亚马逊云科技资深开发者布道师。

在软件研发和征询畛域超过十年的架构设计、经营和团队治理教训,对云上分布式架构设计和优化、XOps、微服务治理、云原生运维、分布式可观测性结构与混沌工程企业实际等有深刻的钻研和丰盛的案例教训。近年来,继续在混沌工程实战畛域,受到海内外大会邀请,分享无关亚马逊云科技的教训和案例,引起共鸣。自 2019 年推动新的亚马逊云科技混沌工程服务(FIS: Fault Injection Simulator)立项与落地,该服务于 2021 年 3 月胜利公布。

                                        ** 听众受害 **

● 混沌工程可能对 IT 人员带来什么价值?
● 混沌工程的倒退历史及将来趋势是什么?
● 混沌工程适宜哪些工作场景?
● 混沌工程在数字化企业中的实际难点和思路?

                                        ** 报名形式 **

扫描海报上的二维码即可报名,开发者报名后会立即收到确认邮件,请留神查收~

正文完
 0