关于运维:智能运维-VS-传统运维|AIOps服务管理解决方案全面梳理

4次阅读

共计 7670 个字符,预计需要花费 20 分钟才能阅读完成。

云智慧 AIOps 社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设衰弱共赢的 AIOps 开发者生态。

运维服务治理的问题与挑战

数字化转型背景下的 IT 运维

随着业务的不断创新倒退,麻利开发、容器化、云计算等新技术的利用越来越多,与此同时,业务零碎架构也变得越来越简单,传统运维工作将会面临更多、更大的挑战。因而,确保 IT 零碎的继续衰弱是保障用户体验和业务倒退的根底。在上述背景下,云智慧将运维存在的挑战分为人员、流程、技术三个维度:

  • 人员方面:现阶段,IT 运维人员总是被动发展工作且重复性操作较多,在面对数百上千设施以及疾速迭代的技术栈时,因不足标准化的治理,使得更加宏大的业务零碎难以应答;
  • 流程方面:IT 运维类的管理制度标准化水平有余;运维人员工作负荷也难以量化体现且不足认同感。
  • 技术方面:在面对宏大的设施和零碎数量时,企业短少自动化技术手段进行治理,导致企业对业务零碎的可用性预警有余,运维工作被动。

IT 运维中面临的现状与痛点

基于上述对运维背景及挑战剖析,云智慧将企业 IT 运维典型问题演绎总结为以下几个方面:

  1. 流程与制度不欠缺,存在沟通灰度;
  2. “建转运”过程不标准,效率低,运维工作量化能力弱,无奈造成考核根据;
  3. 不足运维常识积淀;
  4. 不足 AI 技术在运维服务治理中的利用。

新一代 IT 服务治理是业务与技术倒退的必然

在上述的挑战下,运维服务治理的实践和工具都有了新的变动。ITIL 4 引入了服务价值体系的概念,它能够为组织提供一个弱小的、对立的、以价值为核心的方向。随着企业数字化的转型和倒退,IT 服务共享核心正在成为企业 IT 的重要服务支点,如何在工具中体现对共享服务型组织的撑持,成为了新一代 ITSM 的重要方向。在往年的 ITSM 工具要害能力报告中,Gartner 提到了一个重要的能力 -AITSM,即人工智能在 ITSM 中的利用,例如基于人工智能的虚构助理机器人,为用户提供对话式自助 IT 服务;联合知识库实现主动解决方案举荐;基于深度学习的相似工单等利用场景。以上均为新一代 ITSM 的技术倒退和利用。

此外,ITIL 4 在新时代客户体验、价值流和数字化转型的背景下,从新提炼了更多的 ITSM 实际,也采纳了新的工作办法(如精益、麻利以及 DevOps),也促使 ITIL 跟上了新时代。云智慧在实践和前沿技术的指引下,推出了云智慧数字化服务治理解决方案。

解决方案

  • IT 服务管理体系—夯实组织信息化建设根底

数字化运维的残缺场景为当业务用户方提出服务需要时,IT 运维组织则会通过各种治理流程和流动来提供服务促成价值共创。一个企业信息系统价值的实现,30% 在于建设,70% 在运维,稳固运行能力施展业务价值。数字化运维服务治理的外围价值在于标准化、规范化、精细化治理。从业务用户角度登程,便捷地申请服务申请、申报故障以及提出新需要是他们关注的重点。与此同时,问题解决过程疾速,过程可视化,对于业务用户来说也是良好的服务体验。以上过程的实现背地则需依赖于迷信的治理流程和运维组织撑持。从 IT 运维组织角度登程,规范化、可量化 IT 服务则是重中之重。因而,运维治理则须要提供服务目录以及考核运维流程指标。此外,配置管理也是整个运维场景中的外围因素,它会为其余流程提供配置项信息数据,反对其余流程运行。例如,在变更治理流程中,配置管理能够提供变更影响剖析,帮忙评估变更危险和招集变更评审人员;同时,配置管理也为运行综合剖析和自动化作业、容量治理等场景提供根底数据。

  • 分层设计的产品架构,不断改进优化产品

基于上述的理论知识和用户实际场景,云智慧研发了数字化运维管理系统(DOSM)和 CMDB 两款产品,从产品维度云智慧将其分为了两个产品线,在理论落地的应用场景中,这两者亦是松耦合关系。

下图架构图从零碎技术实现的维度来介绍数字化运维平台的产品能力和功能模块。云智慧将产品所要实现的具象性能,形象为一个个彼此独立又互为关联的模块,并将这些模块依据业务及数据逻辑进行分层组合。

  • 零碎设置层:提供了通用性的零碎本身治理能力,包含对立用户核心和日志审计,接口能力等;
  • 能力引擎层:是 DOSM 的外围能力层,为整个产品的流程、表单、音讯告诉、搜寻、内容聚合打下基础;
  • 业务设置层:是一些业务性能的配置和实现的能力,如运维治理流程的配置,以及一些通用业务,如例行工作、值班等;
  • 功能模块层:数字化运维服务治理性能落地,提供规范流程和表单模板,日常运维小工具等;
  • 对立门户层:提供了个性化的内容聚合、大屏数据展现、报表报告剖析等性能。

下图右侧是与云智慧本身产品或第三方产品的集成能力,包含 ChatOps 机器人、自动化产品、监控工具、门户、告警核心、挪动平台等。

  • 专业化、标准化的 IT 共享服务中心,降本增效

IT 共享服务中心是 IT 服务治理的一个重要场景,也是 IT 集约化倒退的一个体现。现如今很多大型企业组织都在将 IT 独立进来,促使其从老本核心走向利润核心,共享核心不再仅仅为一个特定的业务服务,而开始思考服务老本。以上则必须先通过标准化服务来晋升服务质量和效率,升高服务老本。从整个企业组织层面来看,IT 共享服务中心能够防止反复建设 IT 服务治理平台和人员投入。对内,对立治理基础架构和资源能够无效地撑持组织业务运行;对外,提供标准化的服务能力和流程共享(如资源申请,账号开明,业务报障等)能够实现 IT 服务端到端的价值交付,从而晋升数字化体验,以及赋能业务倒退。

  • 内置最佳实际,疾速帮忙企业规范化 IT 服务治理

云智慧数字化运维服务治理产品,基于 ITIL 4 最佳实际,内置了多个 ITIL 规范治理流程,包含事件、问题、变更等多个罕用流程,从而升高了用户配置难度,让用户可能疾速上手实际。此外,产品还反对本地化公有部署和 SaaS 购买模式,本地化部署当初已齐全反对容器化部署,具备了更便捷的部署和服务扩大模式。

以上 ITIL 中的罕用流程均能够在云智慧数字化运维服务平台中开箱即用,以此帮忙企业组织高效解决、标准运维过程。上面为几类高频运维场景实例:

  • 服务申请:次要是对外提供标准化服务,像申请虚拟机、邮箱扩容、域账号重置等,标准化的服务申请能够让 A 和 B 用户同样的服务体验;
  • 事件治理:指标是疾速复原业务,第一工夫解决故障,尽量减少业务中断工夫;
  • 问题治理:次要指标是查找根因,找出解决方案。流程次要是通过重现故障,考察剖析,找到解决方案;
  • 变更治理:变更是运维中的常见场景,变更是为了解决故障,晋升可用性。该流程次要是做变更危险评估,变更计划评审,业务验证等一系列流程动作。

  • 多渠道的提单入口,晋升用户报单体验

对于终端用户来说,零碎的易用性是可能推广进来被宽泛应用的根底。云智慧数字化运维服务治理平台提供了多渠道服务入。云智慧 DOSM 采纳了 H5 技术,实现了所有挪动终端和利用统一的用户体验。此外,在挪动端云智慧能够反对:企业微信、钉钉、飞书;不便用户随时提交工单同时也不便运维人员可能挪动解决和审批工单流动。在 PC 及 Web 页面,云智慧 DOSM 领有云小慧机器人;同时,云智慧 DOSM 还反对与监控零碎、告警核心以及第三方零碎的集成,从而实现了主动生成工单的性能。

  • 智能的虚构助理,晋升用户自助服务体验,加重一线工作量

云智慧在新一代 ITSM 中人工智能在运维服务治理中的利用也走到了业界的前沿。基于此,云智慧研发了虚构服务助理(云小慧),云小慧实质上是一个 ChatOps 工具,反对多轮自然语言对话的机器人。内置在 DOSM 中,能够让用户以对话的形式间接获取服务或者帮忙用户提报工单。在传统 ITSM 体验中,用户须要非常复杂的流程才能够实现工单提交(通过关上网页 -> 输出 DOSM 域名 -> 找到须要的服务目录 -> 新建并填写工单 -> 提交工单),而云小慧则通过全新的服务获取形式,让用户与 ITSM 零碎的交互方式有了一个微小的改革。通过云小慧,用户能够间接以自然语言在对话框中说出需要,随后人工智能则会主动答复或提报新的工单。

  • 可视化的服务过程,让流程进度高深莫测

IT 服务对大多数业务用户来说,是一个黑盒子。业务用户提出需要工单后,无奈通过可视化的服务过程跟进工单详情,以致用户体验度较差。因而,云智慧 DOSM 提供了工单过程的可视化跟踪治理,用户能够理解工单的进度,还能够在工单中与运维反对人员疾速进行文字沟通,高效解决工单。

  • 交互式的服务台,晋升服务体验

服务台在 IT 组织中,除了存在物理组织,还有一些是虚拟化的组织,甚至还有机器人服务台。服务台作为企业组织 IT 服务的对立入口,是一个管家的角色。用户除了能够通过服务台获取 IT 服务,还能够搜寻知识库自助解决问题。云智慧的 DOSM 内置了一个实在的服务台模块,帮忙企业治理用户和呼叫核心的坐席人员。坐席人员能够通过 DOSM 的 Web 端即时或延时响应用户,第一工夫解决问题或将无奈解决的工单分派到后端的运维反对组织,并反馈后果给用户。此外,坐席人员还能够间接点击聊天信息,依据用户的问题在聊天界面的知识库搜寻和推送常识。与此同时,用户方能够在 Web 页面,或者通过即时通讯工具中的云小慧机器人找到人工服务,关联用户信息并创立工单。

  • 多级服务目录,标准化 IT 服务能力

云智慧 DOSM 反对多级服务目录,能够对 IT 部门提供的所有服务进行分类目录,用户能够通过目录疾速获取服务。局部规范服务申请能够联合自动化技术,实现主动交付,从而晋升服务能力,升高服务老本。如标准化的虚拟机申请、网络端口开明、服务启停等。

  • 灵便的服务级别协定,保障 IT 服务质量,量化运维人员工作量

服务级别协定是服务量化的根底。云智慧 DOSM 反对灵便的 SLA 设置,通过测量流程节点间或全流程的耗时,来确保服务在约定的工夫里实现。此外,DOSM 的逾期揭示和降级解决机制,也进一步保障了服务可能按时交付。

  • 灵便的表单和流程设计,疾速定制企业专属流程

ITSM 管理工具泛滥,市场中有超过 400 个不同的产品。从最根底的帮忙台工单工具到高级的自动化的工具,都号称能反对用户自定义流程设计,而各工具间也有较大差距。流程引擎的灵活性,表单模板的易用性,反对的字段类型是否反对触发器,内部接口调用等性能,都决定了用户在应用工具自定义治理流程的可行性和难易度。在 DOSM2.0 版本中,云智慧将表单设计模块的组件进行抽离,反对通过利落拽的形式在表单画布上进行设计,晋升了产品的易用性;此外,云智慧 DOSM 基于 Activiti 流程引擎,反对分支流程、并行流程、子流程等多类流程;内置 10+ 表单字段类型,反对字段分组、字段联动以及工单属性页配置,全面满足工单定制要求,能够疾速帮用户实现新流程的落地。

  • 分类的运维知识库,积淀运维教训,晋升运维效率

知识库在 ITIL 中是一个重要的模块。知识库能够在治理中继续施展价值,帮忙用户自助服务,进步服务台首问解决率,升高整体运维的人员老本,积淀运维组织教训。云智慧 DOSM 内置的知识库,能够联合智能机器人和即时服务台,帮忙用户尽快解决问题;知识库自身也反对了富文本内容编辑,常识的导入导出,常识的审核、公布流程,确保常识的准确性。

  • 灵便的报表剖析组件,开掘运维数据价值

针对流程的 KPI 和日常治理的运维指标,云智慧 DOSM 除了提供开箱即用的 ITIL 惯例报表之外,还反对用户进行自定义报表,指定数据源,报表字段和展示形式,进行自定义,同时也反对对报表进行排期,定期发送报告。

  • 对立的 CMDB ,打造动静牢靠的配置信息库

CMDB 是指蕴含每个配置项及配置项之间重要关系的详细资料的数据库,治理所有配置项及其关系,以及与这些配置项无关的事件、问题、变更和公布等信息。CMDB 作为 IT 服务治理外面的外围配置库,会为其余流程为其提供信息,如变更治理流程提供的无关 IT 组件变更的信息、洽购流程提供的无关 IT 组件洽购信息。此外,CMDB 也为自动化操作提供指标信息,并记录执行历史。

云智慧 CMDB 能够反对数据联邦、和谐和同步;灵便的信息模型定义;反对主动发现;具备欠缺的 API 调用接口,进行数据共享。

  • 精确的配置管理数据,助力多种运维场景

所有 CMDB 所治理的资源肯定要有应用场景是建设 CMDB 的外围逻辑关系。要想各种场景被正确执行,就会要求 CMDB 所提供的资源是精确且实时的;这样运维人员才会有能源去致力保护和更新 CMDB 的数据,以确保运维的工作可能顺利开展。

在做故障剖析过程中,须要依据配置项管理所提供的基础架构配置方面的信息剖析问题和已知谬误与配置项之间的关系,并依据配置管理数据库中的信息对事件和问题进行考察和剖析,如通过比拟基础架构的理论配置与配置管理数据库中的被批准的配置来发现基础架构的缺点。此外,如果企业须要做大屏数据展现剖析,CMDB 能够提供数据撑持。

  • 主动发现,流程管制,数据审计,保障配置数据的准确性

当下有很多企业组织在建设 CMDB 时最终成果均不是很现实,甚至到起初会缓缓废除。这其中最大的一个问题就在于配置项数据的准确性不够。数据不精确,CMDB 应用价值就越来越。而云智慧次要靠主动发现、流程管制、和数据审计来解决数据鲜活、精确的问题。

  • 主动发现:可自定义采集模板,内置 20+ 种配置项主动采集脚本;
  • 配置管理流程:通过流程管制,确保入库的数据是精确可信的;
  • 数据审计:通过多源数据比对,数据同步日志监控,同源数据定期校验等形式。

  • 对接告警零碎,问题解决更及时

DOSM 对接告警零碎实现了基于告警事件的主动以及手动创立工单,使告警处理工作更加流程化与标准化。同时云智慧的产品反对在创立告警工单时主动生成告警详情并主动关联配置项,大大提高了故障根因剖析和故障解决的效率。在少数状况下,监控工具进去的告警并没有业务信息、管理员等重要数据,这些都须要 CMDB 的数据进行补充和丰盛,这样进去的告警信息可能帮忙运维人员更疾速地理解告警的重大水平,从而更疾速地解决故障。

云智慧的价值与劣势

  1. 造成齐备的解决方案与服务体系

云智慧运维征询涵盖运维各畛域体系建设与专项征询。围绕 ITSM 落地的三驾马车(ITSM&CMDB 治理征询、ITSM&CMDB 工具以及施行交付)打造了全套、全流程的解决方案与服务体系。通过与业界顶级合作伙伴一起实现新一代 ITSM 工具 ——DOSM&CMDB 的落地与交付施行。此外,云智慧提供全面的解决方案,以 ITSM、CMDB 咨询服务为外围服务体系,在顶层给予企业客户业余领导。与此同时,云智慧交融了 DOSM、CMDB 等规范产品,将顶层布局交融产品进行落地施行,从而将理念转化为事实。

  1. 提供一站式 ITSM 治理咨询服务

云智慧能够提供一站式 ITSM 治理咨询服务,次要蕴含以下几方面:

  • 权威受权:AXELOS 官网受权的中国首家 IT 服务治理征询合作伙伴;
  • 规范制订:中国智能运维国家标准制订单位之一;
  • 业余团队:征询参谋来源于世界 500 强企业或者业余征询公司,人数 20 人以上;
  • 经验丰富:资深参谋均匀从业超过 10 年以上。

  1. 对立运管服务、晋升服务价值
  • 价值总结:降本增效;
  • 标准流程:赋能外部经营过程,提供流程化的综合治理平台;通过驳回最佳实际,进步 IT 外部服务水平,以及服务级别的持续保持;依据 IT 的组织架构明确运行保护流程。
  • 提高质量,晋升效率:欠缺知识库性能及行业运维常识积攒;大大缩短故障解决周期;让行业外围技术人员解脱重复性工作,专一技能晋升。
  • 进步客户满意度:为服务台管理员提供考察工具,用以征求客户对相应服务水平的满意度反馈,从而进步客户满意度。明确日常工作指标,建设以客户为核心的服务体系。
  • 建设规范服务管理模式:建设行业 IT 服务治理运行模式,明确 IT 服务治理的服务计量。通过主动解决放慢问题解决过程,使 IT 各部门进步生产效率、改良服务交付的能力,为要害业务服务提供稳固、高质量、低成本的牢靠的服务。

案例分享

  • 案例一:打造某科技公司 IT 服务治理平台

企业背景:该科技公司无规范服务体系,全流程无奈追踪且 CI 信息芜杂无管理工具

解决方案:云智慧通过征询 + 产品施行的形式,笼罩数据治理、流程治理、工具补齐全面改善运维体系。以 DOSM 产品为根底,通过顶层征询布局优化客户流程,实现业务零碎价值增效

  • 案例二:构建某能源团体共享服务中心

企业背景:该企业次要存在以下问题:

  1. 企业难以对立治理,须要无效的隔离进行数据窃密;
  2. 企业子公司泛滥,面向不同租户,需提供个性化服务门户;
  3. 企业缺失对立的账号治理,账号治理流程不标准;各零碎间用户数据不对立,准确性差,难以满足与团体对立身份认证零碎对接的各利用零碎账号治理的问题;
  4. 企业之前的流程零碎架构老旧,难以撑持数字化转型;
  5. 企业流程规范不一,无奈无效标准业务服务;存在报表定制能力有余等问题。

解决方案:云智慧提供的解决方案次要蕴含以下几方面:

  1. 平台引入微服务、大数据、智能化算法等技术搭建平台技术架构。提供多租户、交互式及自助式等多种服务模式,部署至集团公司 PAAS 平台,从根本上晋升团体 IT 运维治理的规范性、安全性和先进性,更好的施展平台对团体业务利用的对立运维、有机协同、集中管理、共享粗放的撑持作用;
  2. 优化欠缺 IT 服务管理体系文档,对 ITSM 零碎性能进行梳理迁徙,扩大新性能满足财务共享核心服务需要,实现新老 ITSM 零碎平滑迁徙。

  • 案例三:建设某运营商 CMDB 治理平台

企业背景:该企业次要有以下需要:

  1. 保障根底数据的唯一性与准确性,实现 IT 资源逻辑关系的横向整合与纵向贯通;
  2. 利用新技术,实现配置数据动静收集,为进一步提高运维管理水平及利用智能运维等新技术提供效率奠定数据根底;

解决方案:云智慧提供的解决方案次要蕴含以下几方面:

  1. 规划设计 35 类配置模型,梳理 IaaS、PaaS、SaaS 三层配置管理并落地到 Cloudwise CMDB;
  2. CMDB 新增变更影响剖析模块,依据变更对象及上联业务模型关系,输入受影响的服务、核心、零碎、业余数据,提供给变更工单,作为变更评审的参考之一;
  3. 告诉参加变更评审的对象。利用 CI 之间的关系能够无效地将相干的 CI 连接起来,从而为故障和问题的解决、变更的打算和执行提供更好的参照。

开源福利

云智慧已开源数据可视化编排平台 FlyFish。通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现合乎本人业务需要的炫酷可视化大屏。同时,飞鱼也提供了灵便的拓展能力,反对组件开发、自定义函数与全局事件等配置,面向简单需要场景可能保障高效开发与交付。

点击下方地址链接,欢送大家给 FlyFish 点赞送 Star。参加组件开发,更有万元现金等你来拿。

GitHub 地址:https://github.com/CloudWise-…

Gitee 地址:https://gitee.com/CloudWise/f…

万元现金流动: http://bbs.aiops.cloudwise.co…

微信扫描辨认下方二维码,备注【飞鱼】退出 AIOps 社区飞鱼开发者交换群,与 FlyFish 我的项目 PMC 面对面交换~

正文完
 0