现如今,随着日益增速的业务环境,运维在企业中的角色越来越重要。如何在盘根错节的IT零碎架构中升高现场故障解决工夫、进步运维效率,是每个IT运维工程师都必不可少的技能。

为解决上述运维人员窘境,2021年12月30日,云智慧AIOps社区邀请云智慧开发运维工程师Larry Zhang在线分享了开源运维治理平台OMP的性能个性、应用场景等要害内容,更是通过实际操作具体地介绍了如何通过OMP实现运维智能化。

简介

OMP是云智慧自主设计研发,集轻量级、聚合型、智能运维为一体的综合运维治理平台,具备纳管、部署、监控、巡检、自愈、备份、复原等性能。通过加重交付难度,晋升运维自动化、智能化,进而晋升运维整体效率,保障业务运行的连续性和安全性。

性能个性介绍

  • 主机纳管

OMP反对页面增加和批量增加两种形式纳管主机。增加过程中OMP会验证主机SSH连贯信息,验证通过后即可创立主机。此外,主机创立实现后OMP会主动装置 Agent端,装置实现后也会主动对主机进行监控。点击监控按钮能够查看主机监控面板,通过主机详情页面也能够查看主机详细信息及历史记录。

  • 服务公布

OMP反对页面上传和后端扫描两种形式公布服务包。使用者能够依据理论状况抉择适宜的形式公布服务包,OMP会对服务包进行验证,验证通过后,即可胜利公布。 服务包公布胜利后,会在利用商店中展现所公布的服务列表,使用者能够点击查看进入到服务详情页面,查看服务详细信息。

  • 服务治理

在利用商店点击装置,抉择服务版本后,进入装置流程。波及到依赖信息的服务,OMP会主动将依赖服务显示进去,保障服务装置完后的可用性。 此外,使用者可依据抉择的服务数量,进行服务散布和服务配置批改。装置过程中,OMP会优先装置依赖服务,点击“查看具体装置信息”后 可查看装置脚本输入内容。装置实现后OMP会主动对服务监控,在服务列表中能够对服务进行进行、启动、重启、卸载等操作。

  • 监控告警

异样清单中会展现正在处于告警状态指标数据,帮忙使用者理解以后异样主机、服务。通过点击监控按钮,能够查看该服务的监控面板。告警记录能够帮忙使用者查看历史告警信息,通过点击监控按钮,能够查看该服务的监控面板。此外,监控设置中使用者能够依据理论状况,配置监控组件的地址信息,也能够开启邮件推送,抉择告警信息承受邮件。

  • 状态巡检

OMP中巡检共分为3个维度,别离是 深度剖析、主机巡检、组件巡检,在巡检记录中抉择所需的巡检内容即可。巡检执行实现后,能够在线查看,或者导出巡检报告,也能够通过邮件推送报告到指定邮箱。

  • 默认指标

使用者能够在指标核心对立设置默认的告警指标,告警指标会对巡检、监控同时失效,当主机或服务资源应用超过阈值时,触发告警。

  • 零碎设置

当纳管主机或服务须要降级或保护时,能够开启保护模式。保护模式下,OMP会克制所有告警告诉。通过邮件设置,能够设置发件邮箱信息。

应用场景剖析

  • 多云环境集成
  • 疾速部署环境
  • 主机批量治理
  • 主动监控告警
  • 资产信息记录

实际答疑解惑

  1. OMP中巡检的目标是什么?

巡检的目标次要是对主机和服务工夫做状态快照,以此能够查看该时间段主机和服务的状态。

  1. 巡检和监控的区别是什么?

巡检的颗粒度更细一些,次要是对内核等信息进行监控;而监控只会对主机CPU等级别信息的一个监控。

  1. OMP中监控是用什么技术实现的?

目前是通过prometheus操作实现。

  1. OMP能采集到设施上的日志吗?

目前OMP采集的是服务日志,可在安装包中指明服务日志门路进行日志采集。

  1. OMP所有组件都开源了吗?

是的,目前OMP所有的组件均已开源。欢送大家登陆Github或Gitee点赞反对~

OMP GitHub 地址: https://github.com/CloudWise-...

OMP 国内镜像地址: https://gitee.com/CloudWise/OMP

更多福利

微信扫描辨认下方二维码,备注 【OMP】 退出AIOps社区OMP开发者交换群,与更多行业大佬一起学习交换~

讲师介绍:Larry Zhang (张磊) ,云智慧服务工程部-服务效力二部运维开发工程师,致力于云智慧开源我的项目运维治理平台(OMP)的产品研发,撑持外部交付体系疾速部署监控产品,领有丰盛的运维治理平台和PaaS平台设计开发教训。