关于容器技术:云杉网络发布DeepFlow-5G核心网网络功能服务监控方案

25次阅读

共计 3161 个字符,预计需要花费 8 分钟才能阅读完成。

5G 将开启产业互联网改革的新篇章,推动 5G 交融利用倒退是业内共识。GTI 最新公布的《5G 智能化网络白皮书》强调,网络智能化是 5G 网络高效高质建设部署和经营不可或缺的能力。如何为用户提供更高质量、更有保障的通信服务,成为运营商乃至整个社会信息化倒退的重要课题。

5G 核心网运维的新挑战

5G 核心网(_5G Core_)是电信运营商 5G 建设的重要组成部分,采纳全新技术,在实现网络部署、网络性能、新业务发展的同时,监控保障也面临全新挑战。在 4G 核心网(_EPC,Evolved Packet Core_)中,网元由专有设施承载,硬件属性较强。而在 5G 核心网环境中采纳基于服务架构(_SBA,Service Based Architecture_),融入云原生、微服务等设计思维,以软件化,模块化、服务化的形式构建核心网。对于全新核心网的运维保障,面临如下挑战:

网络性能解耦使监控对象数量激增

根据 3GPP 定义,5G 核心网的各网络性能(_NF,Network Function_)在性能级别上解耦,拆分出若干个独立的网络性能服务 (_NFS,Network Function Service_),这些网络性能独立运行,提供标准化服务接口,通过互相调用拜访实现网络性能。在 5G 核心网计划中,虚拟化、云原生技术的融入,使通用服务器取代专有硬件设施,与此同时虚构网元,虚拟机、容器 POD 的数量飞速增长,每个工作负载同时提供多个 IPv4、IPv6 工作立体。

相较 4G EPC,因为泛滥方面演进叠加在一起,在 5G 核心网 SBA 架构中虚拟化后的 NFS 实例数量以 2 个以上的数量级增长,须要监控的对象数量微小是 5G 核心网保障侧第一个挑战。

服务自动化减少了网络追踪的难度

通过网络性能仓储 (_NRF,NF Repository Function_),5G 核心网的各类网络性能服务得以自动化治理,实现服务的主动发现以及注册、更新、状态检测等,防止服务拜访中进行大量手动配置工作;集中控制面能够将大量跨区域的信令交互变成数据中心外部流量,优化信令解决时延;依据业务利用的变动,按需疾速扩缩网络性能和服务,进步网络的业务响应速度。自动化治理在生产侧晋升了管理效率,同时在核心网保障侧减少了动态性强、难以跟踪的新挑战。

门路优化与交互解耦贬低了监控复杂度

4G 核心网的网元之间的通信遵循请求者和响应者的点对点模式,是一种互相耦合的传统模式。在 5G 核心网服务化架构下,各网络性能服务之间能够依据需要按需通信。5G 核心网架构下的网络性能服务间通信机制进一步解耦为生产者和消费者模式,具备灵便可编排、解耦、凋谢等长处,是 5G 时代迅速满足垂直行业需要的一个重要根底能力。各网络性能在理论利用过程中,防止了不必要的网络直达,但服务间的调用依赖,拜访追踪,性能剖析,故障定位等也成为运维保障侧的新挑战。

DeepFlow 5G 核心网网络性能服务监控计划实际

DeepFlow 是一款面向 5G 核心网,基于对服务 NFS 间的通信拜访流量进行获取剖析,以保障核心网稳固运行的软件产品。在整体计划中,可按解决逻辑分为流量获取、数据散发传输、诊断剖析三大部分,通过流量采集预处理形象层,提供流量采集及预处理的北向治理接口,使整个监控平台具备可扩大的根底数据获取能力。

通常 5G 核心网环境中,次要波及到 KVM 虚拟机与容器 POD 的网络流量获取。DeepFlow 5G 核心网网络性能服务监控计划反对 IPv4、IPv6 协定环境,紧密结合 HTTP v2 协定,实现服务间关联依赖监控。本文基于运营商理论 5GC 运行环境,化繁为简并以 Free5GC 环境为根底进行介绍。

What is free5GC?
The free5GC is an open-source project for 5th generation (5G) mobile core networks. The ultimate goal of this project is to implement the 5G core network (5GC) defined in 3GPP Release 15 (R15) and beyond.

Free5GC 是 5G 核心网开源软件我的项目,总体架构基于 3GPP 规范、遵循 SBA 框架,采纳虚拟化形式实现网络性能,可运行 5G 核心网的规范服务,并且能够模仿相应工作流程。在理论 5G 环境中,少数厂商曾经采纳容器技术承载网络性能服务。在本文中,采纳虚拟机运行容器,创立 Kubernetes 集群,搭建 5G 核心网验证环境,使能各网络性能。通过云杉网络的 DeepFlow 平台实现对各网络服务的监控保障。实际过程中部署的组件包含控制器、采集器以及数据节点。

由大到小追踪网络服务

在 5G 核心网的监控实际中,由大到小,逐级有序地展现服务运行状态及关联关系。通常依据工作流程分为三大范畴,较大范畴以数据中心所属区域或资源池划分,其次为网络性能或服务类型,比方 AMF、UDM、SMF 等,最初将集中在 IT 单元,比方容器 POD、宿主机、IP 等。DeepFlow 平台依照三类范畴由大到小的操作划分,为核心网所波及到的简单网络提供残缺的、逐级的监控跟踪。下图出现的是各类型网络性能服务运行及调用关系全景视图,将服务接口(_SBI,service-based interface_)中的网络各性能间的调用通信,以及性能指标进行主动绘制并出现。

实际过程中,关注服务间重点指标,包含网络层(吞吐、载荷),传输层(并发连贯、TCP 建连时延、TCP 零碎时延,TCP 重传、建连失败),应用层(HTTP 申请、HTTP 时延、HTTP 异样),绘制拜访调用关系全景视图后,在常识图谱性能反对下,能够迅速关联列举相应的常识维度。

分钟级定位异样边界范畴

5G 核心网中存在大量的、简单的 NFS 间服务调用,具备无效的调用性能跟踪能力尤为重要。

如上图所示,一个简略的逻辑调用,AMF(Access and Mobility Management Function)中的 NFS 调用 UDM(Unified Data Management) 中的 NFS 获取用户信息,这个过程中,并不是像传统环境中直观简略。在 5G 现网环境中,广泛波及宿主机、虚拟机、容器的网络虚拟化实现,以全栈分段来梳理拜访调用,是应答新环境运维排障挑战所必须具备的。以全栈视角,开展以上调用,能够分析 NFS 发动调用所通过的 POD 接口、虚拟机接口、宿主机接口乃至网关等链路。

全栈跟踪针对云中服务间的调用拜访,将虚拟化所实现的逻辑通信进行逐渐开展,清晰便捷展现每段的网络状态,性能,联合常识图谱及丰盛的指标数据,疾速定位性能异样的问题范畴边界。以上所述拜访为例,如果排查调用延时故障,确定 NFS 调用服务双端后,开展全栈跟踪,间接定位延时所在的接口。如全栈跟踪示例图中,清晰展现出服务 AMF 服务实例至 UDM 服务实例两端拜访延时瓶颈在 UDM 性能侧,且聚焦在其运行所属虚拟机的虚构网络接口处。而排除 UDM 服务实例的 POD 网络接口及 AMF 所涵盖的虚拟机、POD 等泛滥接口门路。

在没有 DeepFlow 全栈跟踪工具的状况下,排查服务拜访调用的性能将是一个脉络缭乱、简单繁琐且简短的过程,同时对于一线运维人员要求所把握的技术栈绝对较多、要求综合能力强,很可能耽搁贵重的运维窗口工夫。

总结

以上 Free5GC 示例运行在实验室环境,模仿运行了相应的测试用例,理论生产场景较实验室更加环境简单且规模微小,势必对运维保障提出更高要求。通过理论环境测试验证,DeepFlow 平台也的确能为 5G 核心网填补监控保障空白。

DeepFlow 帮忙 5G 核心网在基于服务架构中对立采集服务间的网络流量,实现对拜访调用的全面性能监控,并提供容器化后的全栈门路跟踪,补齐 5G 核心网服务监控空白,应答云原生特点,紧密结合 5G 服务,解决 5G 核心网生产中遇到的监控、运维、保障等难题。

正文完
 0