关于运维:云网管-云上构建网络自动化体系

1次阅读

共计 2431 个字符,预计需要花费 7 分钟才能阅读完成。

简介:云网管是基于阿里云网络多年技术和教训积淀打造的云上智能网络管理运维平台,提供企业网络全生命周期治理运维的能力,让部署更快捷、运维更高效、网络更通明。

1. 背景

云网管是基于阿里云网络多年技术和教训积淀打造的云上智能网络管理运维平台,提供企业网络全生命周期治理运维的能力,让部署更快捷、运维更高效、网络更通明。

1.1 用户痛点

1. 装置部署难

传统网管大多都是本地部署,用户须要负责物理资源布局、中间件装置、安装包部署等等工作,通常须要业余的网络和 IT 保护人员数天甚至数周能力部署上线。

2. 集中管理难

网络设备自有的厂商网管,个别只能提供本地 web 拜访形式,不能集中管理,更做不到跨厂商治理,无奈给用户提供对立的治理视角,须要多套网管零碎之间切换应用。

3. 网络扩大难

办公、批发场合随着业务的扩大,常常须要全国各地疾速开店,目前网络的交付都是网络工程师通过 console 口登录一台台配置下发,效率低下且容易出错。

2. 产品介绍

2.1 网络管理范畴

如下图定义网络管理的全生命周期,传统的网管零碎,对网络的治理次要针对网络退役阶段,面向的是已上线网元的资源管理和运维监控等,无奈做到网络设备的全生命周期治理。


图 1 网络管理全生命周期

云网管对网络的治理是贯通整个生命周期的,在网络未上线的时候,能够离线规划设计,定义网络架构;在建设交付的时候,将定义好的网络架构以我的项目的形式进行施行,整个交付过程流程可控,品质可管;验收通过后,网络正式进入退役阶段,在该阶段网络的外围诉求是稳固运行、少出故障以及故障产生后的疾速定位和故障复原,云网管的监控、变更、巡检等模块确保网络退役阶段的稳固运行直到网络下线。在整个网络生命周期中,资源管理确保网络资源与实在网络的一致性。

2.2 产品性能介绍

2.2.1 建设交付

  • 架构设计

在网络尚未上线时能够事后进行网络布局,网络架构用于定义网络组网的互联标准和技术规格,提供图形化的架构设计和治理性能,通过图形化的形式进行组网拓扑的灵便编排,并对各个网络组件的具体规格进行配置。
如图通过可视化的形式进行网络架构设计,定义网络模块的数量和连贯关系。


图 2 网络架构设计

联合设计好的网络布局和配置标准,主动生成可一键导入的规范配置文件。


图 3 配置文件生成

  • 建设交付

建设交付是将网络计划以我的项目的模式进行设施下发,在每个我的项目中以工单的模式管制交付过程和保障品质。


图 4 建设交付我的项目施行

2.2.2 智能运维

  • 态势感知

通过全局视角和分支视角对网络整体状态进行实时感知。
衰弱度: 联合设施告警状况、网络巡检情况、监控笼罩水平等多维度对网络情况进行评分。

动静拓扑: 通过 LLDP 和 MAC 扫描技术准实时拓扑更新,设施连贯关系、端口信息等实时出现。

  • 一体化监控

一个办公分支或者门店的网络,个别是涵盖了多个档次的网络,蕴含多种网络状态的设施。通常包含接入运营商的网关设施,进行数据转发的网络设备(路由器或交换机),提供 WLAN 的无线设施以及形形色色的终端利用。一套从网到端全链路笼罩的监控计划是必要的,因为往往端侧的异样,可能是有线网络的问题,有线侧的故障,会影响上游端侧多个终端或利用的应用。

云网管针对有线网络、无线网络、终端利用等不同网络档次的设施,通过被动采集、事件接管、插件部署、被动拨测等多种监控技术,从网关到终端全链路监控网络运行状况。在如下的监控视图里将交换机上联口流量、到运营商的进口流量、AP 的终端连接数以及终端的监控信息等有线和无线的指标在一个视图里实现监控。

  • 网络编排

云网管提供可视化的流程编排引擎,用户通过拖拽的形式将网络操作的原子能力串联起来,保障业务下发时的事务残缺和平安。

1. 残缺业务流程编排定义

2.单步配置流程可视化下发

  • 故障自愈

日常高频的故障场景,基于云网管的网络编排能力,能够将告警联动解决计划,疾速实现故障止血和业务复原。

3. 架构介绍

3.1 技术架构

  • 协定插件

云网管的协定插件集成了管理网络所须要的 ssh、telnet、netconf、snmp、grpc 等协定,反对治理市面常见的商用网络设备。

协定插件通过加密的平安通道与云端的采集管制实例进行通信,高效执行云端下发的设施操作指令和采集工作,并将数据压缩后实时反馈给云端进行剖析和展现。

协定插件的 Agent 反对以云网管自有硬件、软件安装包、集成 SDWAN 网关等多种形式输入。

  • 采集管制

采集管制实例在云端部署,在云网管的整体架构中起承前启后的作用。

调度引擎的工作流程: 1. 接管网络编排下发的工作,按工作优先级、调度打算等策略,将工作进行正当拆解和调度。2. 依据设施厂家型号等维度将指令通过模板翻译映射为操作设施的具体指令。3. 将指令下发到 Agent 执行,期待接管执行后果 4. 工作执行后果剖析和拼装

模板治理: 模板分为“用户模板”和“设施模板”两类,“用户模板”只具备业务含意,屏蔽了厂家差别,在网络编排中间接援用,“设施模板”是细化到厂商、型号粒度,不同的厂商之间都有显著差别。例如:“ACL 策略”的设施模板,思科和华为是不同的指令。

  • 网络编排

网络编排负责业务模型的对立形象和定义,网络编排将原子能力按业务流程进行串连,造成具体的网络计划。网络计划通过流程引擎驱动采集管制实例执行每一步的原子操作,以工单的形式管制事务残缺和链路追踪。

  • 利用

网络编排以 API 的模式对利用提供能力和数据接口,应用层实现具体的“资源管理”、“网络巡检”、“网络变更”、“故障复原”等能力,反对运维人员进行日常的网络运维、业务配置等工作。

3.2 部署架构

云网管 SaaS 化部署,分钟级开明云上网管实例,用户侧只用部署探针(硬件版只须要上电和网络可达)即可。

云网管的计算和存储资源都是应用的阿里云资源,能够依据规格随时扩容,基于阿里云 ASK 集群实现的 CI/CD 性能,能够随时迭代上线新性能。

4. 总结

云网管致力于为简单、异构、分支泛滥的线下网络打造一款免部署、易上手、集中管理的 SaaS 化网络运维治理平台。

原文链接
本文为阿里云原创内容,未经容许不得转载。

正文完
 0