乐趣区

关于阿里云:阿里云数字化安全生产平台-DPS-V10-正式发布

作者:银桑、比扬

阿里云创建于 2009 年,是寰球当先的云计算及人工智能科技公司。阿里云为 200 多个国家和地区的企业、公共机构和开发者,提供平安、牢靠的云计算、大数据、人工智能等产品和服务。阿里云作为全国首家云等保试点示范平台和首家通过国家等保四级备案测评的云服务商,为中国超过一半的上市公司,为 80% 中国科技翻新企业提供云计算服务。

家喻户晓,阿里巴巴双 11 是对业务来说是一个举世无双的挑战。在大促期间,集群规模超过百万,单集群规模达到 10000 以上。2019 年双 11 的数据库峰值能力达到 54.5 万笔订单每秒,数据库 TPS 达到 8700 万,实时计算 Blink 解决峰值达到 25 亿音讯每秒,音讯零碎峰值达到 1.5 亿音讯每秒。这些数值是对业务的极致性能和极致稳定性的要求,其中的业务稳定性离不开全面的高可用架构和伎俩来保障。阿里云在海量互联网服务以及历年双 11 场景的实际过程中,积淀出了包含全链路压测、线上流量管控、故障演练、多活容灾和平安生产等高可用核心技术,并通过开源和云上云下服务的模式对外输入,以帮忙企业用户和开发者享受技术红利,晋升零碎稳定性和业务连续性。

图 1:企业数字化平安生产解决方案:阿里巴巴业务连续性实际

数字化平安生产平台(Digital Production Stability,简称 DPS)外围面向 1-5-10 应急响应场景,提供应急事件和故障的发现、响应和解决,提供应急场景的定义与治理、故障监控布防、故障上报、故障应急协同、故障过程跟踪、故障复原、改良措施的全生命周期治理能力。帮忙客户晋升业务稳定性,为客户提供故障应急场景下的一站式服务。

现在,云原生曾经成为企业数字化转型的要害策略,因为利用须要疾速开发和交付,这就促使企业采纳云原生的办法来开发利用,以提高效率,并减少灵活性。对于身处云原生时代的企业和开发者而言,不仅须要采纳云原生的伎俩来应答业务的高速迭代,更要关注业可用及连续性治理建设。数字化平安生产平台则帮忙客户促成业务与 IT 的全面协同,从业务集中监控、业务流程治理、应急指挥响应等多维度来帮忙客户建设欠缺业余的业务连续性保障体系。

数字化平安生产平台外围面向业务连续性治理,围绕业务提供危险预警、决策撑持、指挥调度和组织经营四大板块能力,同时每个板块由多个能力域独特组成,通过具体的业务场景(如 1-5-10 应急响应)串联整个业务流程。

  • 危险预警。 通过监控核心、事件核心两大外围能力,提供基础设施、业务利用的实时监控信息,配合应急场景定义、监控项关联、事件响应与解决、ChatOps 协同等能力,为客户业务提供实时监控告警和危险通告,实时理解业务的运行状况。
  • 决策撑持。 通过根因定位、智能剖析和日志核心三大外围能力,在业务呈现告警事件甚至故障的状况下,提供丰盛的定位伎俩和数据来撑持业务变更决策。反对业务的智能巡检,指标关联类、调用异样类的根因定位;反对数据库调用、接口调用、利用性能和调用链的剖析与查问。同时也反对多种日志类型采集与剖析,从日志中查问业务运行状况。
  • 指挥调度。 当业务告警事件或者故障须要面临变更时,通过与高可用产品的深度集成,提供丰盛的变更解决伎俩来应答业务变更。流量防护提供利用防护和网关防护能力,能够配置多种流控规定来应答大流量或者服务不稳固调用的场景;开关预案提供疾速的、有打算的变更解决。
  • 组织经营。 业务的连续性治理不仅仅是保障利用的高可用,更多是业务人员的应急协同,从而为客户打造 SRE 型组织。平台提供组织协同治理、工单、知识库等能力,帮忙客户将运维人员和业务利用通过流程化的形式进行协同治理,应急响应责任到人,通过工单、事件单和演练评测的形式等形式实现组织协同。

点击​​ 此处 ​​,理解阿里云云原生更多相干资讯~

退出移动版