乐趣区

关于运维:2022爱分析-IT运维厂商全景报告

报告编委

张 扬 爱剖析 联结创始人 & 首席分析师

姜明星 爱剖析 高级分析师

王 鹏 爱剖析 分析师

1. 钻研范畴定义

钻研范畴

IT 运维指的是企业 IT 部门采纳相干的办法、伎俩、技术、制度、流程和文档等,并借助各类运维工具,对 IT 软硬件运行环境、业务零碎、运维流程、运维人员等进行综合治理。

爱剖析基于对国内 IT 相干部门和数字化服务厂商的调研,依照服务治理、云治理平台、智能运维、运维治理、监控、可观测性平台对 IT 运维市场进行划分。

基于对 IT 运维发展趋势的剖析,本次报告遴选三个市场进行重点钻研:

首先,随着企业数字化转型的疾速倒退,IT 零碎数量快速增长,此外,云原生架构的利用导致系统复杂度越来越高,传统运维形式曾经无奈满足企业的需要,因而,借助 AI 技术能力实现运维智能化,进步运维效率和运维品质,成为 IT 运维的必然趋势。

其次,云原生下的业务零碎由单体利用过渡到微服务模式,单个利用被拆分成多个黑盒的、虚构的微服务,而且各微服务调用关系异样简单,企业难以全面掌握业务整体运行状态,故障排除难度剧增。为了保障某些重点业务零碎的稳定性,企业须要实时把握从服务申请到 IT 基础设施端到端的调用链路,以及各调用节点的运行状态,因而,可观测性变得日益重要。

再者,随着企业上云、用云速度的一直放慢,以及云利用水平的深入,企业在多云治理和运维方面面临挑战,企业须要借助云治理平台,进步多云资源对立治理能力,进步云资源交付效率,晋升云资源应用效率,升高云老本。

综上所述,本次报告重点遴选出智能运维 AIOps、可观测性平台和云治理平台 CMP 三个市场进行重点钻研,并通过对各特定市场的需要定义和代表厂商的能力解读,为各行业企业 IT 运维布局与厂商选型提供参考。

图 1:IT 运维市场全景地图

厂商入选规范

本次入选报告的厂商需同时合乎以下条件:

  • 厂商的产品服务满足市场定义的厂商能力要求;
  • 近一年厂商具备肯定数量以上的付费客户(参考第 3 章各市场定义局部);
  • 近一年厂商在特定市场的支出达到指标要求(参考第 3 章各市场定义局部)。

    2. 厂商全景地图

爱剖析基于对甲方企业和典型厂商的调研以及桌面钻研,遴选出在 IT 运维市场中具备成熟的产品或解决方案的入选厂商。

3. 市场定义与厂商评估

爱剖析对本次 IT 运维我的项目重点钻研的特定市场定义如下。同时,针对参加此次报告的局部代表厂商,爱剖析撰写了厂商能力评估。

3.1 智能运维 AIOps

定义:

智能运维 AIOps 指的是利用机器学习等人工智能技术,通过对海量的运维数据进行剖析开掘,实现监控、告警、根因定位、自动化运维等 IT 运维流程的自动化和智能化,进步运维效率和运维品质,为业务稳固运行提供保障。

终端用户:

IT 运维部门

外围需要:

随着企业的 IT 架构向云原生转变,零碎复杂度越来越高,数据量快速增长,数据治理和故障定位难度随之增大,企业须要进步运维效率和运维品质。此外,企业信息系统规模不断扩大,IT 运维对象快速增长,企业须要投入大量人力保障业务零碎的稳固运行,运维老本一直增长。外围需要次要包含:

  • 对运维数据进行对立治理,进步数据应用价值。随着企业零碎数量的快速增长和零碎复杂度的进步,运维数据量快速增长,作为监控告警、根因定位剖析的重要根底,运维数据曾经成为企业的重要资产。然而,因为不足对立的数据规范,不同运维数据难以无效交融,企业无奈对数据进行无效应用。因而,企业须要对运维数据进行对立治理,进步数据应用价值,为智能运维利用奠定数据根底。
  • 借助 AI 能力,进步运维智能化程度。随着 IT 架构向云原生演变,企业应用零碎也由单体利用向微服务转变,零碎变得越来越简单,数据量也快速增长,告警剖析、根因定位难度加大。面对以上挑战,通过专家进行告警剖析和故障定位,效率越来越低,且专家已有的教训很难对新呈现的故障做出无效的判断,运维品质难以保障。鉴于此,企业须要借助机器学习算法和 AI 能力,对运维数据进行智能化剖析,对海量告警进行智能降噪,疾速进行根因定位,进步运维效率与品质。
  • 进步 IT 运维自动化能力,升高运维老本。随着业务规模的增长,企业 IT 零碎规模随之增大,并且对系统的稳定性要求越来越高,为此,企业须要投入更多的人力对主机、利用零碎、容器等庞杂的 IT 资源进行治理,运维老本居高不下。企业须要借助 AI 技术,对 IT 资源进行自动化、智能化治理,升高人工依赖度,管制运维老本。

厂商能力要求:

厂商可能提供 AIOps 相干产品或解决方案,具体能力如下:

  • 具备数据治理能力。厂商可能反对多种数据采集形式,可能采集企业的各类运维数据;具备多种常见数据格式的解析规定,可能对非结构化数据进行解析。在此基础上,对数据进行对立交融、荡涤等,为企业提供全面的、高质量的运维数据资产。
  • 具备智能化能力。首先,厂商可能利用大数据和人工智能技术,对数据进行智能化治理和剖析,为智能运维利用提供撑持。其次,厂商须要具备智能告警、智能日志剖析等智能运维利用,可能为客户提供成熟的产品或解决方案。
  • 具备自动化运维能力。在基础架构层面,可能将运维工作中的日常巡检、补丁治理、资源创立等进行自动化解决;在利用层面,可能依据零碎运行状况进行主动扩容、主动部署、自动更新;此外,当产生故障时,零碎可能进行自动化响应,主动复原故障。通过对 IT 基础架构、业务利用日常工作以及运维的自动化解决,缩小人工投入,升高运维老本。

入选 规范

\1. 合乎智能运维 AIOps 的厂商能力要求;

\2. 最近一年在该市场服务客户数 10 家以上;

\3. 最近一年在该市场支出 1000 万元以上。

代表厂商 评估

(注:以下代表厂商评估均按厂商简称首字音序排序)

鼎茂科技

厂商介绍:

鼎茂科技是一家数智经营科技企业,以平台 + 算法为外围科技,面向混合云环境,自研数智经营平台和 AIOps 系列智能利用,帮忙客户实现闭环性精准运维和实时的决策撑持。业务笼罩金融、制作、医疗等多个行业。

产品服务介绍:

鼎茂科技在 AIOps 畛域聚焦数智平台和场景化智能利用。数智平台层面,鼎茂的 ARCANA PaaS 产品具备数据收集与存储、数据分析与治理、原子化 AI 算法算子、可编排运行引擎、可视化组件框架等运维根底能力。场景化智能利用包含智能日志剖析治理、全域智能运维,以及异样检测、智能告警、根因剖析、容量预测等智能运维规范场景产品。

厂商评估:

鼎茂科技的 ARCANA PaaS 数智平台具备 AI 全流程驱动能力,在数据实时采集和治理方面特点突出,在日志剖析、信创适配方面也具备肯定劣势。

ARCANA PaaS 数智平台数据实时采集能力强。针对目前支流监控平台、日志平台及大量物理设施,ARCANA PaaS 数智平台间接通过旁路通道采集数据,取代数据库 API 接口方式,防止了数据从机器设备流入数据库的提早问题,确保数据的高时效性。例如,在应用 Zabbix 监控工具时,该平台借助 Zabbix 的 Real Time Exporter,在 jack-server 收到数据后间接将数据取走,保障数据低延时。

ARCANA PaaS 数智平台兼容性强,在 AI 加持下,具备较强的数据治理能力。首先,ARCANA PaaS 的兼容使平台可能与企业已有各类监控体系疾速交融;其次,ARCANA PaaS 具备数据治理全流程的智能化能力,可能在简单的 IT 环境中将算法所需的数据进行荡涤、匹配,基于机器学习能力进行数据治理,并通过算法一直学习、演进,造成智能化的数据治理能力。同时,ARCANA PaaS 也可能对日志、指标、调用链、CMDB 等数据进行互相关联,解决运维数据互相割裂的状态,为下层利用提供撑持。

日志作为 AIOps 利用的一个重要数据源,鼎茂科技具备独特的日志治理和剖析能力,依靠 ARCAN PaaS 建设并独立运行的日志与审计平台,以 NLP 技术为根底,基于构建的 AI 模型,通过模式发现、关联性剖析、因果剖析、异样特征分析,对日志中的常见文本、特色产生显著变动的文本以及文本间的相关性进行监测,实现日志模式异样检测,疾速实现故障定位。此外,该平台在日志治理的全生命周期各个环节均使用 AI 技术进行智能、主动的剖析治理,可能晋升日志治理的效率和准确性。

在 AI 技术的研发和利用上,ARCANA PaaS 采纳独特的原子化 AI 算法服务引擎,将鼎茂科技在多畛域的先进算法以原子化、可编排的形式集成,实现疾速无效的场景剖析利用。算法引擎采纳微服务架构,面向智能服务接口,通过 service gateway 解耦业务需要和算法原子能力,实现 AI 算法原子化设计。利用 service mesh 架构和 gRPC 接口框架,反对多种数据源应用同步和异步等多种调用形式实现智能化服务。

鼎茂科技产品信创适配范畴较广。鼎茂科技与信创局部技术厂商进行了数十项适配认证,通过信创适配,有利于进步国产化软件方面运维效率和运维品质,为客户国产化软硬件代替提供助力。

典型客户:

建设银行、交通银行、富国基金、威马汽车、大华医院

LinkedSee 灵犀

厂商介绍:

LinkedSee 灵犀 2015 年成立于北京,是一家致力于为企业提供云计算和大数据的智能 IT 运维产品和解决方案的服务商,以满足客户一直增长的规模需要和 IT 架构迭代需要。灵犀业务已笼罩金融、互联网、运营商、能源、政府等多个行业。

产品服务介绍:

LinkedSee 灵犀全栈智能运维平台包含数据源、数据平台、算法平台和利用场景四层架构。数据源方面,平台内置 70 多种自主采集和零碎接入模版,运维数据起源丰盛;数据平台方面,可能提供流式数据治理服务;算法平台方面,平台内置多种算法,可能适配不同利用场景;利用场景方面,平台具备指标预警、故障预测、运维审计、画像剖析等智能利用,可能满足客户多样化运维需要。

厂商评估:

LinkedSee 灵犀全栈智能运维平台具备较强的综合能力,在智能合规运维、智能硬件监控方面具备独特劣势。

灵犀将运维数据和 AI 算法置于等同重要地位,并反对丰盛的智能运维场景,全栈智能运维平台综合能力较强。首先,灵犀的运维数据中台采取高可用分布式架构,能够实现大规模批量数据的解决,每天能够解决几十 TB 的增量运维数据。其次,全栈智能运维平台内置了近 30 种算法,包含指标异样检测、告警收敛聚类、日志异样检测、行为序列、关键词图排序等算法,通过对各类算法进行组合,能够满足用户不同利用场景的需要。通过将运维数据和算法联合,构建各类 AIOps 场景,目前曾经反对落地指标异样检测、日志异样检测、多重故障溯源、故障根因剖析、堡垒机异样检测等 15+ 个智能运维场景,在智能日志预警剖析、指标预警剖析、故障根因定位等方面具备劣势。

基于独特的行为审计、脚本检测、AI 画像能力,灵犀能够帮忙企业进步运维安全性及合规性。首先,针对企业运维人员的各类操作,全栈智能运维平台通过行为审计算法,将所有运维操作留痕,并对留痕数据进行剖析,主动判断是否存在歹意操作行为,有助于晋升企业运维安全性及合规性。

其次,全栈智能运维平台内置命令拼写错误、命令序列谬误、首尾命令谬误等多种错误模式检测,在运维人员进行要害操作前,基于档次聚类 + 异样检测算法,可能判断预设的操作命令拼写是否谬误、命令是否合乎逻辑等,能够防止因人工审核可能呈现的辨认漏查而造成重大失误。

此外,全栈智能运维平台具备 AI 行为画像能力,通过算法对外部运维人员在各个系统产生的操作数据进行剖析,造成行为画像,并依据特色进行分群。在此基础之上,灵犀为每个群体建设行为工夫散布基线和行为序列基线,并对运维人员当下行为进行监测,疾速发现异常行为,进步不合规行为管理效率。

例如,灵犀帮助某银行构建运维行为画像剖析体系,基于 AI 模型主动建设 110664 个异样检测点,其中 309 个异样检测点发现异常,发现异常行为 89 条,波及人员 62 人,核实确认异样行为 12 个,帮忙该企业晋升外部不合规行为管理效率。

灵犀具备较细颗粒度的硬件监控能力,故障预测成功率较高。首先,灵犀科技的 LinkedMonitor x86 产品通过 IPMI、smbios、cpu 原生接口、硬盘 /raid 原生接口和 sysfs,确定能够抓取几百项数据,能够实现更细粒度的硬件监控,全面把握硬件运行状态。其次,通过监控数据分析,该产品可能在超大数据中心场景下,实现对硬盘故障的预测,提前 24 小时故障预测成功率高达 95%,故障修复成功率 60%,晋升了企业业务容错率。

典型客户:

中信银行、华夏银行、民生银行、国泰君安证券、中信建投

擎创科技

厂商介绍:

擎创科技 2016 年成立于上海,是一家智能运维 AIOps 落地解决方案供应商。擎创科技专一于以 AI 赋能运维治理,激活运维数据智慧,助力客户数字化转型。其客户群已笼罩银行、保险、证券、制作、能源及交通运输等多个行业。

产品服务介绍:

擎创科技的夏洛克 AIOps 智慧经营平台包含运维数据采集、数字运维中台、应用层、经营决策核心。数据采集层通过代理、数据湖、API 模式接入海量异构数据;数字运维中台提供数据治理、流批一体数据处理、AI 能力平台服务;应用层提供日志解析、告警辨析、指标解析等智能运维利用;经营决策核心实现对系统运行状态的洞察,为业务决策提供撑持。

厂商评估:

擎创科技主打“中台 + 场景”的 AIOps 一体化能力,在数字运维中台能力、告警降噪、日志剖析、容量预测等方面具备劣势。

数字运维中台具备实时数据处理能力,内置多种算法模型,产品易用性强。首先,数字运维中台可能基于一套规范的数据算法形容标准,将各平台的数据加载到该中台,实现跨平台对立的数据治理,为智能运维利用提供全面高质量的数据资产。其次,该中台具备较强的流式解决引擎,反对 PB 级数据的实时处理和图形化数据流编排。此外,AI 平台内置十多种自主研发的算法模型,能够进行交互式算法调优、后果评估、模型治理,晋升不同场景下对算法建模调参的便当度,有利于不足 AI 教训的运维人员便捷应用。例如,擎创科技为国内某大型银行搭建的运维大数据平台,实现了主动排查和解决故障隐患,该平台通过智能算法,比传统监控均匀发现问题的工夫提前约 15 分钟。

基于机器学习能力,擎创在告警降噪和关联剖析方面具备竞争力。擎创夏洛克告警辨析核心以机器学习算法为驱动,对海量的告警事件进行降噪和关联剖析,辅助根因定位。该平台通过辨认算法甄别告警内容相关性、时序相关性和拓扑相关性事件,将重复性告警与类似告警进行自动化克制,也可能基于告警“熵值”算法,实现告警动静的优先级举荐,晋升偶发性、级别低但重要的告警级别,将未产生生产事变的反复告警做降级解决。例如,擎创科技为某国有大行搭建智能运维平台,通过对类似告警进行自动化克制,每天的告警数量降至有余原来阈值告警的 1 /10,误告率显著降落。

日志方面具备多样化开箱即用模板及智能剖析能力。首先,日志精析核心提供常见场景的利用包,并定期公布新利用包,通过利用包简化配置及剖析过程,进步利用场景的配置效率,达到开箱即用的成果。其次,日志速析专家将海量的日志聚类到肉眼可读的数量,通过对日志的实时指标提取,指标的聚合计算等不同维度的剖析,智能辨认日志产生法则,剖析日志异样并进行智能告警,用户无需解析日志构造也能够发现故障、定位根因。

容量异样预测准确度较高。擎创科技采纳趋势预测算法对容量利用率指标进行自动化监测,并基于对企业历史数据增长状况的剖析,主动预测磁盘利用状况,能够提前 3 - 4 周对容量异样进行精确的预报。

典型客户:

中国银联、浦发银行、国家开发银行、上汽公众、交通银行

3.2 可观测性平台

定义

可观测性平台是指面向云原生环境下利用零碎的运维需要,对利用申请的调用链进行追踪,并对各调用节点进行精准监控,实现申请所调用的各层级软硬件资源运行状态的可观测,及时发现甚至提前预判异样,疾速实现根因定位,保障系统稳固运行。

终端用户:

IT 部门

外围需要:

微服务架构下,零碎调用关系变得极为简单,企业很难全面掌握业务零碎的整体运行状态。此外,微服务架构和容器化的部署形式,使得零碎环境动态性加强,再加上快速增长的数据量,系统故障定位难度加剧。具体需要为:

  • 买通端到端的全链路数据,清晰展示 IT 资源调用状况。与单体架构和分布式架构相比,微服务的服务拆分粒度很小,每个服务都对应惟一的业务能力,单个业务利用往往须要调用多个微服务,微服务之间也会互相调用,这就导致系统调用关系极为简单,企业很难掌握业务零碎的整体运行状态。因而,企业须要围绕重点业务场景,对用户申请的调用链进行追踪,清晰展示业务零碎各申请 IT 资源调用状况。
  • 对各调用节点进行监控,疾速进行根因定位。微服务模式下,零碎环境动态性加强,每个服务实例存在的周期极短,呈现问题时现场往往曾经毁坏,难以进行剖析;此外,随着零碎复杂度的晋升,运维数量也呈 TB 级增长,也对根因定位带来很大挑战。传统模式下,运维人员须要对全副的 IT 零碎进行运维治理,而不是针对特定利用零碎进行全面监控,所以很难对单个利用零碎的故障进行疾速、精准定位。因而,企业须要实时把握申请所调用的各层级资源运行状况,疾速进行故障定位,保障重点业务的稳定性。

厂商能力要求:

厂商需可能提供可观测性平台相干产品或解决方案,具体能力如下:

  • 具备端到端的数据买通能力。厂商可能基于某个具体的业务利用场景,利用各类技术手段,实现从用户申请到 IT 基础设施端到端调用链数据的买通,对各用户申请的调用关系进行清晰展示。
  • 可能对各调用节点进行监控,疾速实现根因定位。厂商可能围绕具体的业务场景,构建分析模型,通过对调用链数据、指标数据、日志数据等运维数据的综合剖析,清晰展示调用链各节点的运行状态。当业务零碎产生故障时,可能迅速进行根因定位,进步故障修复效率,保障业务零碎稳固运行。

入选 规范

\1. 合乎可观测性平台的厂商能力要求;

\2. 在该市场累计服务客户数 3 家以上;

\3. 最近一年在该市场支出 300 万元以上。

代表厂商 评估

(注:以下代表厂商评估均按厂商简称首字音序排序)

日志易

厂商介绍:

日志易是一家专一于机器大数据平台、服务和解决方案的供应商,通过一站式解决机器数据采集、治理、利用,帮忙企业实现监控告警、可观测性、关联剖析等智能运维利用,晋升企业 IT 运维效率。日志易业务笼罩金融、运营商、电力、能源等多个行业。

产品服务介绍:

察看易是一款日志易基于本身平台特色推出的业务深度全景可观测性产品。察看易通过对业务、服务、设施、指标四层维度数据分析,帮忙企业理解利用零碎实在运行状态,并通过增强日志、链路、指标数据的关联剖析,疾速发现问题,进步故障定位效率,缩短问题解决工夫,保障业务零碎的无效运行。

厂商评估:

业务可观测性方面,察看易产品在端到端的运维数据买通方面具备显著特点。撑持可观测性的根底运维能力方面,察看易具备较强的数据采集、治理和剖析能力,可能为可观测性提供重要撑持,进步故障剖析、根因定位效率。具备如下劣势:

业务可观测性方面,首先,察看易通过附加属性标签实现端到端数据买通,形式独具特色。察看易重点围绕交易类、查问类等场景,基于运维数据分析须要,构建数据模型,将用户查问 ID、交易类型、交易渠道等业务属性标签,以及机器版本环境、调用链等属性标签,主动附加在业务流程的日志下面,买通端到端的运维数据,实现对交易业务全流程的可观测性。

其次,对于企业临时无奈间接采集到的指标,察看易基于调用链数据、业务指标数据,通过统计分析的形式,进行二次解决,实现数据的采集。此外,基于既定的业务场景,察看易提前构建好数据分析模型,并基于此,对接入的数据进行实时荡涤和剖析,及时发现问题,疾速进行根因定位,促成运维效率的晋升。

买通端到端的数据后,察看易不仅能够横向查看每个应用服务与其它服务之间的关联关系,还能够纵向查看应用服务与基础设施组件之间的关联关系,且故障考察门路中波及的所有服务、组件、基础设施等通过上下文信息实现关联,保障整个考察流程的无缝连接。

撑持可观测性的根底运维能力方面,首先,察看易数据采集范围广,数据治理和剖析能力强。察看易可配置的数据起源蕴含文件和目录、Syslog、脚本获取、性能数据、数据库数据、Beats、Packetbeat、S3、Kafka 等,可能针对多类平安产品、操作系统、数据库、中间件及业务零碎等的指标、日志、调用链数据进行采集,采集范畴较广,可能为企业运维可观测性提供海量数据源。察看易对 PB 级日志、指标、调用链在内的各类工夫序列机器数据进行智能运维算法剖析,实现运维零碎可观测性。

其次,察看易基于对立的数据模型构建拓扑图,通过智能运维算法在拓扑图上找出根因,主动将雷同根因产生的告警合并成一个,主动剖析出故障起因和影响范畴,帮忙用户疾速定位故障根因。

典型客户:

广发银行、北京银行、宁波银行、山东城商行联盟、亿联银行

3.3 云治理平台 CMP

定义:

云治理平台 CMP 是用于解决企业多云异构资源对立治理的产品,撑持云资源高效交付、自动化运维、云老本管制等,外围能力包含云自动化治理、对立监控告警、费用剖析优化等。

终端用户:

IT 部门、业务部门

外围需要:

随着越来越多的业务负载迁至云端,企业应用的私有云、公有云越来越多,因为云平台来自不同的厂商,须要别离进行操作治理,导致交付效率低、运维治理老本高。企业须要对多个云平台进行对立治理,进步云资源管理能力和运维效率。外围需要次要包含:

  • 对私有云、公有云、混合云等资源进行对立治理。传统形式下,企业对不同云平台别离进行治理,一方面,在应用不同云平台上的产品或进行跨平台云资源配置时,须要进行多平台切换,无奈对立展现各云平台的应用状况,导致云资源利用不平衡。另一方面,企业 IT 人员须要在不同云平台上别离进行雷同的操作,反复操作减少了管理人员的累赘。因而,企业须要对多云资源进行对立治理,进步治理能力和管理效率。
  • 晋升云平台对立监控告警能力。首先,因为各个云平台互相独立,各类 IT 资源也互相割裂,企业想要查看各资源运行状态时,须要通过 API 别离调取各云平台的监控数据,须要较多的人力投入。此外,因为告警数据扩散在不同平台,须要别离对告警信息进行解决,别离派发工单,效率较低。因而,企业须要构建对立监控告警平台,对立监控各云平台的运行状态,对各类告警数据进行对立治理,产生故障时,对立派发工单,进步运维效率。
  • 实现云资源的高效交付,进步 IT 需要响应敏捷性。随着云平台的大规模利用,云资源的交付效率间接影响零碎交付效率。原有状态下,业务部门通过线上零碎申请云资源,而后由 IT 部门进行人工操作交付,交付工夫难以无效保障。因而,企业须要实现 IT 资源申请和交付的自动化,进步 IT 需要响应效率。
  • 晋升云资源费用治理能力,无效升高云老本。随着企业零碎云化水平的一直加深,企业面临的云环境越来越简单,云资源费用治理难度加大,存在资源节约和老本不通明等问题。因而,企业须要构建对立的费用剖析体系,进步云资源应用效率,优化云老本。

厂商能力要求:

厂商可能提供云治理平台 CMP 相干产品或解决方案,具体能力如下:

  • 可能对接各种混合 IT 基础设施,实现多种云资源的对立治理。产品可能兼容企业现有的和新增的支流私有云、公有云、容器云等资源,比方 OpenStack、VMware、华为云、腾讯云、阿里云等,实现多源异构资源对立纳管,晋升云资源管理和应用效率。
  • 可能对各云平台的 IT 资源进行对立监控告警。首先,平台须要反对自定义任意云资源的拓展,可能对各类云平台进行对立监控。其次,具备丰盛的 API 接口,可能从第三方监控工具采集监控数据,并进行对立展现。此外,产品可能灵便配置告警规定,具备多种告警模式,晋升告警的精准性,告警触发后,可能第一工夫告诉到指定用户。
  • 具备 IT 资源高效交付能力。厂商可能提供面向业务部门的云资源申请和交付的管理系统,既要反对单台资源的自助申请,又要反对单台资源联合中间件、多台资源编排等简单场景,业务部门提交云资源申请后,即可实现自动化交付,进步交付效率。
  • 具备多云费用对立治理能力。首先,产品可能反对自定义各类云资源资费规定,对企业各云平台的费用进行计量,并可能摊派到应用部门。其次,厂商可能实时检测资源应用状况,定期清理闲置资源和不合理的资源配置,晋升资源应用效率。

入选 规范

\1. 合乎云治理平台 CMP 的厂商能力要求;

\2. 近一年在该市场服务客户数 5 家以上;

3.近一年该市场相干服务收入规模在 500 万元以上。

骞云科技

厂商介绍:

骞云科技 2016 年成立于上海,是一家致力于构建 AI 赋能的面向多云和 DevOps 的超级自动化运维体系,帮忙客户构建数字化企业的云原生治理平台服务商。骞云科技业务已笼罩国内及海内政务、能源、金融、制作、运营商、互联网等行业。

产品服务介绍:

骞云科技领有自主研发的超自动化云利用治理运维平台,平台涵盖六大云原生治理产品,别离为云自动化治理平台、云继续交付平台、云监控告警平台、云费用剖析平台、云堡垒机、云 ITSM 平台。通过面向云原生的六大产品和多种利用场景解决方案,对立治理异构的公有云、私有云、边缘云上各种服务(IaaS,PaaS,Serverless),帮忙企业实现超自动化 IT 资源对立治理,构建多云超自动化运维管理体系。

厂商评估:

骞云科技的标准化 SaaS 产品 SmartCMP 为客户提供了多种新型云运维治理能力,其中可视化蓝图编排引擎和费用优化引擎具备劣势,可能无效晋升企业的 IT 自动化敏捷性和费用治理能力。

云治理平台的可视化蓝图编排引擎,可能提供面向利用的自动化交付性能,反对面向多节点利用、微服务编排以及多云的混合编排,能够更好地反对古代多云利用架构。在云治理平台上,利用图建模界面,用户能够基于不同场景的需要,通过利落拽的形式,对各类组件进行可视化编排,将各组件之间的连贯关系、蕴含关系等形容进去,即可疾速设计出基于 OASIS 国际标准的 TOSCA 利用蓝图,高效实现简单多节点利用建模,在此基础上,通过一键申请,即可疾速自动化实现部署。该引擎能够最大限度缩小手工操作和跨部门的工单流转,大幅提高 IT 需要响应速度,交付工夫能够从 N 天缩短到分钟级,IT 部门敏捷性无效晋升。

云费用剖析平台可能帮忙企业实现云老本的计费和追踪,基于平台内置的费用优化引擎,可能更好地帮忙企业节约云老本。一方面,平台反对自定义云资源计费规定,可能提供所有云环境的具体费用报告,通过平台清晰展示可视化、多维度的费用剖析后果,可能准确跟踪每一笔老本。同时,基于费用明细归属能力,联合企业多层次组织架构,平台能够将云老本摊派到相应的部门、我的项目、老本核心和人员。通过明细费用归属,企业可能理解各个私有云的费用摊派情况,并能够依据不同的部门权限,对费用剖析和预测进行可视化展示。

另一方面,平台内置的费用优化引擎,自带几十种费用和合规策略,可能基于策略规定,剖析并发现各种不合乎费用优化策略和平安标准的状况,并通过图表模式直观地展现策略的执行后果。对于发现的违规状况,能够通过策略匹配主动优化,也能够基于内置工单零碎和知识库,进步手工配置优化效率。通过费用优化策略,平台能够发现闲置资源、不合理配置的资源,节约企业云开销;通过合规优化策略,能够查看云资源的非法配置。

以快消、制作行业客户等为例,许多客户同时应用多个国内、国内私有云,因为不足跨云综合剖析、对立展现的能力,大量重复性运维工作须要人工实现,面临运维效率低下、云费用账单统计分析艰难等问题。通过骞云的云原生自动化治理平台,企业实现了云资源的对立治理,交付效率大幅晋升,从以天为单位进步到以分钟为单位;通过云费用剖析平台,企业实现了多维度私有云费用的统计和剖析,各级人员能够清晰理解费用应用状况,进步了云老本自动化、精细化治理能力。

典型客户:

太古可口可乐、时代中国、Metlife、兴业证券、沙特阿拉伯政务云

新钛云服

厂商介绍:

新钛云服是一家为企业提供端到端的云和平安治理服务与云治理平台的厂商。新钛云服秉持“以业余成就每一位客户”的使命,通过提供云和平安治理服务、TiOps 混合云治理平台两大业务模式,致力于帮忙企业更好地构建、治理、运维 IT 基础设施和利用,构建信息系统平安与合规管理体系,为企业施行云策略保驾护航,撑持业务实现数字化转型。新钛云服业务笼罩能源、制作、批发、金融、互联网等行业。

产品服务介绍:

新钛云服 TiOps 混合云治理平台(简称 TiOps 云管平台),可能帮忙企业实现异构 IT 基础设施对立治理和 IT 能力服务化,蕴含 ITSM、ITOM、平安基线与费用治理四大场景。其中,ITSM 可能晋升 IT 部门的服务能力、服务效率和服务质量;ITOM 可能实现自动化运维治理与基于数据的经营治理;平安基线有助于晋升企业平安合规程度;费用治理可能晋升企业云资源费用闭环治理能力。

厂商评估:

新钛云服具备较强的综合能力,TiOps 云管平台综合了混合云对立纳管、自动化运维、平安运维和老本治理四方面能力,可能帮忙企业解决综合性治理挑战。具体体现在以下方面:

混合云对立纳管方面,TiOps 云管平台反对对接各家私有云(包含但不限于阿里云、腾讯云、华为云、AWS、Azure)和支流公有云(包含但不限于 OpenStack、VMWare),同时反对对接云原生 Kubernetes 容器集群以及传统的裸金属服务器。对接的资源品种丰盛,除了常见的 IaaS 资源,还反对支流 PaaS 产品的对接和治理。

自动化运维方面,TiOps 云管平台可能对运维脚本进行对立纳管,零碎兼容性强。首先,企业的不同运维人员往往有本人保护的一系列脚本,导致规范不一、治理扩散问题。针对该问题,TiOps 云管平台将各运维团队或集体应用的脚本在云平台里进行对立纳管,进步脚本的复用率;同时脚本的版本管理机制有利于脚本的一直演进和迭代欠缺。其次,该平台 Ansible 脚本模型解决能力突出,可能兼容客户已有的主机组和 Playbook,能够复用客户在 Ansible 下所积攒和积淀的能力,升高平台的应用门槛。此外,该平台反对在主机上部署 Agent,也反对 Linux SSH、Windows 远程管理(WinRM)等形式,满足客户多样化需要。

平安运维方面,TiOps 云管平台内置云堡垒机,可能向用户提供平安、牢靠的拜访云资源的能力。所有的运维操作在平台里均有相应的权限管控,只能登录受权的机器,并对操作工夫与操作流程严格限度,能够无效解决 IT 部门的误操作或歹意操作带来的平安危险。此外,云堡垒机可能兼容 MySQL、SQL Server 等数据库。用户通过平台去拜访后端数据库,可能实现数据库拜访的平安审计。同时,TiOps 云管平台具备平安基线查看能力,可能通过扫描发现主机配置方面存在的平安问题,取代人工执行脚本或手工查看,晋升云平台安全性。

老本治理方面,通过费用核算和主机资源监控实现老本管制。TiOps 云管平台将整个平台的资源和人基于业务树模式按层级构造调配,可能将费用核算到具体业务上,并反对可视化展现。通过老本可视化,促成业务部门进步费用管制意识,正当评估申请应用云资源,实现老本的无效管制。此外,TiOps 云管平台可能对主机的使用率进行监控,将利用率继续低于预期值的主机进行优化,进步资源利用效率,缩小节约,降低成本。

比方,新钛云服帮助某大型游戏公司搭建运维平台,实现对谷歌云、华为云、UCloud 三家私有云的对立纳管,继续定期扫描所有纳管主机资源,并上报长期低负载的主机,帮忙客户节约老本。通过对多云的对立治理,可能依据业务稳定对云资源进行扩容和减配,升高 20% 的经营老本。

典型客户:

lululemon、佳化化学、金赛药业、绝味食品、中船嘉年华
云联壹云

厂商介绍:

云联壹云是一家致力于多云混合云场景下解决企业云资源管理痛点的独立软件开发商(ISV)和服务商,提供一键部署的产品化软件解决方案,是“产品化交融云”理念的首倡者,是开源我的项目“云原生多云混合云治理平台 Cloudpods”的发起者。云联壹云业务已笼罩人工智能、金融、教育、交通、房地产、政府、运营商、IT 等行业。

产品服务介绍:

云联壹云多云混合云治理平台是一个综合 IT 基础设施资源运维治理平台。针对企业在多云混合云场景下 IT 建设、运维、经营过程中的痛点,云联壹云建设云原生、轻量可扩大的技术架构,对立管控企业无论本地机房还是私有云的计算、存储和网络资源及服务,提供面向多云异构环境的资源管控,费用优化,认证平安和监控运维性能,晋升企业 IT 管理效率和经营能力。

厂商评估:

云联壹云在晋升云资源管理效率方面具备劣势,产品外围代码开源,通过开源社区奉献以及开源用户的反馈,使得外围性能具备较高稳定性和易用性,具备面向丰盛场景的性能个性。开源凋谢个性使其易于二次开发迭代和集成。同时,产品还具备肯定的信创适配能力,满足企业信创需要。

云联壹云基于“交融云”的理念,通过虚构映射的形式,对异构云资源进行资源模型和操作的对立,将“多云”交融为“一云”,升高多云混合云场景的复杂度,晋升资源管理效率。

首先,云联壹云重点围绕 IT 基础设施,采纳对立的资源数据模型,通过编码的形式,将各云平台模型图谱里的每个组件、每个资源映射到云联壹云平台,并针对不同云平台产品性能和术语的差异化问题,通过虚构映射的形式进行一致性解决。通过虚构映射,对私有云、公有云等各类云资源进行形象和封装,实现对多云资源的对立治理。

其次,云联壹云会对各类云资源 API 进行对立对接,而后对企业提供对立的 API 以及对立交融的 UI 控制台。用户无需与每个应用的云资源 API 进行对接,仅须要与云联壹云 API 进行一次对接,即可实现对各类云资源的申请和应用,在很大水平上晋升了资源对接效率。同时,云联壹云会继续跟踪各云平台 API 变动状况,并对平台进行更新迭代,用户无需自行跟踪保护,即可获取各个云上相干更新,大大减低了经营治理老本。

另外,云联壹云自带本地虚拟化和裸金属能力,并且放弃和各云平台统一的数据模型和 API,使得一个平台同时治理本地和云上资源,实现“交融一云”的成果。

例如,云联壹云帮助某保险团体纳管多云资源,对立了该企业在各个云平台的资源交付、企业资源交付效率晋升了 5 倍,运维效率晋升了 3 倍,CMDB 资源对接从须要每个云一一对接简化为只须要对接壹云。

云联壹云是基于自有技术体系构建的云治理平台,产品的外围代码开源,提供凋谢 API。企业能够基于 API 或开源代码,对产品进行集成和二次开发,并追随社区版本继续进行迭代优化,一直晋升云管能力。

云联壹云产品具备肯定的信创适配能力,可能兼容国产信创硬件和软件体系。硬件方面,云联壹云在公有云和裸金属方面具备同时治理 x86 和 arm 服务器能力,全面反对国产化硬件,比方,可能适配鲲鹏、飞腾、海光、兆芯等 CPU 产品;软件方面,云联壹云已获得多个操作系统的兼容认证,如河汉麒麟、中科方德、欧拉、统信(UOS)等。通过信创适配,可能为企业软硬件国产化代替提供助力,晋升零碎在信创环境下的运行效率。

典型客户:

泰康保险团体、TCL、神州数码、明略科技、九州证券

4、入选厂商列表

退出移动版