关于运维:实时监控智能预警疾控中心的战疫速度

56次阅读

共计 1769 个字符,预计需要花费 5 分钟才能阅读完成。

疫情常态化下,疾控中心的重要性逐步凸显。

数据显示,自新冠疫情产生以来,中国曾经实现约 115 亿人次的核酸检测。

这是国家卫生衰弱委临床测验核心副主任李金明在 2022 年 4 月 16 日通过央视新闻传递出的一个数字。

另据国家卫生衰弱委公开信息,截至 5 月 5 日,全国累计报告接种新冠病毒疫苗近 33.5 亿剂次,实现全程接种的人数为 125104.2 万人;60 岁以上老年人接种笼罩人数达到 22768.1 万人,实现全程接种 21562.4 万人,老年人群加强免疫接种已实现 16232.4 万人。

核酸检测、疫苗接种,这一系列数字的背地,是疾控中心在对大数据进行归集和剖析,为社会及时提供疫情预测与剖析,无效助力政府科学化决策,成为疫情管控的得力助手。

但新冠疫情的稳定变动,疾控中心也面临着挑战。

疾控中心的信息化挑战

新冠疫情激发并推动着中国经济数字化、智能化改革,对于疾控中心来说,就是更先进的诊断技术、重大疾病的早筛技术、大数据以及人工智能的全方位利用。

疾控中心岂但承当了传染病预防管制的职能,还肩负食品安全、环境卫生、衰弱监测等各项公共卫生业务管理工作,以及发展应用性科学研究的责任,信息化建设堪称公共卫生工作的根底。

以某疾控中心为例。

一方面,对于该疾控中心而言,其运维体系不欠缺,外围利用零碎性能未部署监控工具,产生问题与排查问题比拟滞后,不足预警机制,针对疫苗接种管理系统服务器之间的接口调用关系不足调用梳理工具。

另一方面,则是疫苗接种零碎页面拜访的问题,随着疫苗接种的全面开展,疫苗接种人数逐步激增,该疾控中心的疫苗接种和追溯零碎的数据查问速度十分慢,肯定水平上影响了用户体验。

实时监控,智能预警

基于此,博睿数据认为,对于该疾控中心而言,更为重要的是建设起一套利用性能监控、管理体系,对该疾控中心的要害利用零碎响应工夫进行实时监控,零碎包含公众服务、疫苗追溯、疫苗接种等外围利用零碎,同时应用 AIOPS 事件剖析为上述零碎建设智能预警机制,对疫苗接种利用零碎进行迟缓和谬误剖析,定位连累业务性能的迟缓环节,梳理各利用零碎之间的业务接口的调用关系。

针对该疾控中心面临的难题,博睿数据认为可应用博睿数据 Bonree Server 产品。

Bonree Server 是一款利用性能监控产品,面向业务、研发、运维、SRE、平安等数字化工作人员,在业务公布、监控、故障复原、紧急反对、治理布局等工作时做到成竹在胸、口头无方、高效从容。

采纳被动式监控,通过在服务器上的利用部署或者嵌入探针进行,以 Javaagent 为例:采纳字节码加强式埋点形式,在启动 JVM 时,通过不同的埋点插件笼罩不同的通信协议、中间件、开发框架,对 Java 根底调用代码进行函数级埋点,从而拿到堆栈级的调用信息以及运行态信息。

具体来看,其价值次要体现在以下几方面:

一、智能告警

Bonree Server 内置的事件剖析与智能基线告警性能,为疫苗接种、疫苗追溯、公共服务三个外围利用构建了主动异样监测机制,无需任何手工配置,即开即用地获取到三个外围零碎运行的异样事件累计超过 30000+ 条,并通过邮件、短信进行告警,同时投放至用户现场的监控大屏。

二、建设利用监控与评分零碎

通过 Bonree Server 帮忙用户建设利用监控与评分零碎,全方位监控和记录零碎的利用运行状态,并撑持疫苗接种零碎每日约 500 万次的利用申请。

三、主动构建利用全局拓扑,晋升服务器 ROI

借助 Bonree Server 的利用拓扑剖析性能,帮忙客户梳理疫苗接种管理系统服务器之间调用关。量化利用间的拜访关系,晋升利用零碎工作效率,ROI 晋升 400%,服务器性能晋升 37.5%。

四、定位问题代码,晋升疫苗接种零碎拜访体验

针对疫苗接种零碎拜访迟缓的问题,装置 Bonree Server 探针发现并定位问题,通过全栈快照功能定位到代码问题,帮助开发人员将利用零碎的响应工夫升高 21.3%。

随着分布式应用、云计算的不断深入倒退,业务零碎的逻辑构造正变得越来越简单,应用服务存在不同的平台上一直演变。利用的复杂性和灵活性加大了运维的难度,如何保障 IT 利用零碎可能稳固、高效率的运行,成为 IT 技术保护人员首当其冲解决的问题。

将来,Bonree Server 将在业务数据采集剖析、日志剖析、根因剖析、调用链全文检索以及中间件监控等方面继续发力,助力更多企业进步运维效率。​​​​

正文完
 0