近日,在云智慧推出数据可视化编排平台FlyFish后,又重磅推出开源运维治理平台OMP(Operation Management Platform)。这款由云智慧自主设计与研发,集轻量级、聚合型、智能运维为一体的综合治理平台,具备纳管、部署、监控、巡检、自愈、备份、复原等性能,可为用户提供便捷的运维能力和业务管理,在进步运维人员等工作效率的同时,极大晋升了业务的连续性和安全性。

GitHub地址: https://github.com/CloudWise-...

Gitee地址:https://gitee.com/CloudWise/OMP

为什么云智慧要推出这款性能如此弱小的开源运维治理平台OMP呢?让咱们来听听该我的项目负责人云智慧技术总监Simon的心声:“咱们想把云智慧在智能运维畛域所积攒十余年的翻新实践经验,以开源的形式赋能给宽广的开发者,通过OMP来真正解决运维人的痛点,让运维工作能够更简略与高效,将来咱们冀望与行业内所有人一起来推动AIOps社区的倒退。”

OMP的初衷:切实解决运维痛点

在数字化转型热火朝天的当下,公司我的项目与产品都在疾速迭代降级。这对软件开发者与客户一线驻守的工程师,在疾速装置、疾速定位、主动剖析、监控告警、故障自愈等方面,都提出了新的需要和挑战。

比方当遇到主机登陆不对立的问题时,有的客户容许SSH直连,有的客户须要跳板机,有的客户却只容许显示器操作。产品上线后往往短少成熟的保障机制,如果没有精准的监控、告警、自愈零碎,一旦遇到异样或故障将会十分被动,很难疾速解决问题。 甚至在产品依据后期的布局部署后,因为短少定期的巡检及剖析,运维人员难以疾速把握以后业务零碎的运行状态及业务解决能力从而给出优化计划。

以上的这些问题是咱们通过多方调研理解到运维人员常会遇到的工作场景,以下是咱们简略总结的运维痛点:

  • 主机环境多样性,难以对立治理。如混合云、公有云、跨IDC、虚拟化、容器化等;
  • 业务变更难度较大,主动编排能力较低;
  • 业务监控多平台难以实现数据联动;
  • 业务出现异常难以实现故障自愈;
  • 业务运行状态难以进行评估与剖析;
  • 运维常识匮乏,短少专家领导及专家解决方案。

为了切实帮忙运维人员解决以上运维痛点,云智慧以升高交付难度与晋升产品的可维护性的设计初衷,打造了OMP(运维治理平台),该平台目前领有主机纳管、利用治理、利用监控、状态巡检等外围个性。

OMP外围个性

主机纳管

可纳管所有主机资源,并实时监控主机运行状态,反对在线治理。

利用治理

提供罕用根底组件、应用服务及符合标准的自研产品,反对装置部署、变更公布、弹性扩缩容、在线配置优化等服务状态治理。

利用监控

涵盖规范监控、定制监控、链路监控、智能监控等多种业务场景,可通过大数据智能测算,感知将来趋势,将异样管制在产生前。

状态巡检

定期进行业务指标、运行状态汇总,可按需主动执行并发送报告。

以上这些个性设计源自云智慧多年深耕于运维畛域所获的翻新理念,更有为广大客户提供业余服务的实践经验。OMP优良的不止有搭载云智慧高精技术与算法的个性,还有核心技术架构。

OMP核心技术架构

如上面OMP架构图所示,OMP前端基于Ant Design设计的React框架,后端应用Django框架,集成SaltStack等组件,实现根底性能。Agent端通过saltstack agent端实现对服务的装置管控,并自研monitor agent实现对数据的指标采集。

其中监控组件采纳了以后比拟风行的Prometheus、Grafana、AlertManager、Loki等开源产品。在数据贮存方面,OMP应用了MySQL存储持久数据,Redis用于存储长期数据、缓存及简略的音讯队列。

OMP将来开源打算

在进一步欠缺OMP技术架构与外围个性的翻新实际中,咱们也发现仅有这些个性与性能,或还不足以反对宽广开发者对运维的所有需要,因而咱们仍在继续开源着OMP其余性能,比方以下这些模块,请大家刮目相待的同时,欢送给咱们提出贵重的开发倡议。

故障自愈: 当业务零碎出现异常或故障时,依照预约的自愈策略进行故障治理,极大升高故障对业务影响,缩小企业损失。

备份/复原: 针对外围数据进行备份异地并主动执行并发送备份,达到异地+异地的存储成果,使用户数据足够平安。

精简工具: 搭建运维常用工具、命令、脚本、SQL等,升高误操作及技术门槛,可按需自行保护与裁减工具,为日常运维提供便当。

常识文库: 积攒运维罕用技术、解决方案、业务性能等常识,按需自行保护并裁减常识内容。

小智解答: 当须要如操作文档、解决方案、罕用技术等内容时可疾速检索,当须要技术支持时,可申请人工反对。

开源社区减速翻新

自往年8月份云智慧成立AIOps社区以来,社区先后分享了数据可视化编排平台-FlyFish、云服务治理平台-摩尔平台、Hours算法等产品。其中业内首次开源的智能运维开源数据集-GAIA数据集,填补了AIOps开源集数据畛域的空白,FlyFish开源一周便斩获中国开源云联盟2021优良开源我的项目奖。

将来,云智慧将在AIOps社区中更加器重OMP的翻新与推广,与宽广用户、研究者、开发者一起建设谐和、容纳、凋谢的OMP开发者社区。

如果你想面对面与OMP我的项目的维护者交换,第一工夫晓得OMP开源的信息,扫描下方二维码,增加AIOps社区小助手(备注OMP)的微信呦~