关于云计算:编解码持续升级硬实力铸就视频云最优解

39次阅读

共计 3774 个字符,预计需要花费 10 分钟才能阅读完成。

算力时代,视频云须要怎么的 CPU?

在数据爆发式增长及算法日益精进的大背景下,属于「算力」的时代俨然到来。随着视频成为互联网流量的配角,日趋饱和的音视频场景渗透率、人类对“感官之限”的谋求与冲破、更多元化的场景摸索及技术需要,为视频编码能力和底层算力及硬件反对带来更大的挑战。

“视频云作为音视频行业的基础设施,能极大地简化视频从采集、解决、编码、传输到散发的全链路流程。”正如阿里云视频云技术负责人在《芯事》访谈中所提到的,阿里云视频云与倚天 710 一起,正在踏上视频普惠千行百业的新征程。

点击链接查看视频:https://www.eefocus.com/video/1462707.html

视频云与倚天 710 的联合

2022 年北京冬奥会,阿里云承接了一项重要的工作,那就是撑持冬奥全面上云。为此,阿里云视频云推出了全新的云上翻新解决方案——阿里云聚“Alibaba Cloud ME”,这也是寰球第一次在奥运会上实现异地全息会面,是一次突破时空之距的革命性翻新。在感叹云上沉迷之旅的精妙之余,咱们不禁要问,阿里云视频云上路即狂奔的硬实力是什么?除了使命必达的奋斗精力和弱小的软件、算法撑持能力以外,阿里云视频云技术负责人致凡还提到了 倚天 710

当咱们将眼光投射到倚天 710 上,会发现它诞生于 2021 年,是一款由平头哥自研的云芯片,通过一年多工夫的硬件部署和业务验证,倚天 710 实例已胜利利用到阿里巴巴团体的外围业务中,并服务多家出名互联网及科技公司。正是基于后期低劣的体现,倚天 710 已在阿里云数据中心部署,将来部署规模将持续扩充。

当然,没有一款芯片生来就如此弱小,视频云技术负责人谈到:“视频云和倚天 710 的联合是一段美妙的旅程,但两头还是经验了十分多的事件。”

回忆起这段旅程:“因为视频业务的增长速度是十分快的,研制一颗芯片的周期也十分长,不论是芯片研发、还是芯片落地后适配视频云业务成长,都是极具挑战的,但咱们一起做好了正视挑战、冲破壁垒的筹备。当第一版芯片流片回来后,芯片根本性能体现稳固,且因为 Arm 架构带来的原生劣势,再加上阿里云战争头哥的同学单方坐在一起,在理解芯片外部形成的根底下来做了很多算法调优后,可能让代码在芯片上跑得更快。

同时,倚天 710 还针对特定算法场景进行了指令集减速与优化,比方像 SVE 等矢量计算技术,其中 BF16/INT8 mmla 指令可实现高效的矩阵乘法运算,还反对 Hash、CRC32 等减速指令,能够让单条指令并行处理更多数据,大幅晋升视频编解码、AI 编解码加强等场景性能,这是一个两边一起迭代的过程。”

所以,从最早的性能挑战传统架构 CPU,到当初曾经远远超过传统架构 CPU,倚天 710 的“变质”是一步一个脚印走过去的。视频云技术负责人认为:“这是一个十分好的案例,阿里云视频云的业务跟平头哥的芯片设计可能完满地联合在一起,利用各自的劣势让芯片设计进去,在视频行业中施展更大的作用。”

谈起平头哥和阿里云视频云业务的这次单干,就不能不提到一个大的产业背景,即视频云的爆发式增长。至于什么是视频云?“视频云就像是音视频行业的水和电,是底层的基础设施,能够大大简化视频从采集、解决、编码、传输到散发的链路。”这个比喻再失当不过。

社会视频化在狂飙

从 2017 年开始,短视频的热度持续上升,加上近三年疫情下直播、视频会议、线上教学等畛域的崛起,社会视频化成为一种大趋势。依据 CNNIC 公布的第 50 次《中国互联网络倒退情况统计报告》数据显示,截至 2022 年 6 月,我国挪动互联网接入流量达 1241 亿 GB,同比增长 20.2%;另依据思科公布的数据显示,视频内容约占互联网总流量的 90%,占挪动网络总流量的 64%。

联合这两组数据,咱们能够得出视频正在成为互联网流量的配角,而爆炸性的数据量又将会对算力和存储提出更大的挑战。于是视频云的价值被凸显进去,并呈现出了一种不可逆的倒退态势。在这样的大背景下,寰球以互联网公司为主的科技企业纷纷转型,开启视频云技术的探索之旅,并在 安防监控、近程医疗、批发电商以及金融机构等典型场景中失去落地

以后,视频云产业曾经造成了绝对稳固的头部战队,包含微软、AWS、阿里云等支流云厂商。对于国内视频云的市场体量方面,依据 IDC 公布的数据显示,2022 上半年中国视频云市场规模达到 50.5 亿美元,同比增长 15.7%,预计到 2026 年,市场规模靠近 300 亿美元。值得一提的是,通过报告显示,阿里云视频云间断 5 年占据中国视频云整体市场份额第一,并且渗透率还在一直攀升。

视频产业倒逼技术迭代

对于视频云产业来讲,以在线视频为例,从最早国外的 Livestream、国内的斗鱼直播到当初,曾经经验了 25 年的历史,其实从技术的角度来看,整个行业倒退的速度没有设想中的快。比方,视频编码从 H.264 到 H.265,再到 H.266,均匀 10 年降级一代。为什么速度不是很快?因为 它要解决的问题比拟多:算力、网络传输、规范 等等。然而,咱们看到明天的视频产业倒退十分迅猛,这也倒逼技术要去实现疾速迭代。这几年曾经初显成果,比方当初编码器的降级迭代速度是 5 年,以前是 10 年,预计前面可能是 3 年。

为什么这里要强调编码?事实上,视频云是一个算力密集型行业 ,视频信息量很大,如果采纳和文本、图片一样的压缩模式,那么还原度是不够的,所以视频必须进行编码解决。编码要是做不好,不仅会损失视频品质,还会带来传输难度高的问题。从 MPEG2 开始,每一代视频编码的降级,其压缩率大概能够晋升 50%,远低于视频分辨率每更新一代晋升 4 倍的速度,即便这样,每一代降级对 CPU 算力的需要,以及算法复杂度都会进步至多 10 倍以上,这对芯片的架构、芯片底层的指令集优化、芯片的存储器和 cache 构造都会带来新的挑战,很多外围的算法要用新的指令集从新写一遍, 这意味着视频编码和芯片成长是须要同步的

视频云须要怎么的 CPU?

通过后面的介绍,咱们理解到视频编码对算力的要求很高,因为咱们经常试图 用算力换存储,用算力换传输带宽,所以咱们心愿算力越高越好。

那么如何晋升 CPU 的算力?首先要抉择好的内核架构。在视频畛域,传统架构曾经有三十几年的历史了,目前市占率仍然能达到 90% 以上的份额,但裹挟着 惨重的向后兼容包袱。而 Arm 作为一种精简指令集,不仅没有历史包袱,还能够依据需要减少很多寄存器,同时从内存 cache 构造的设计和指令集的设计下面,可能更贴合须要大算力的视频解决需要。此外,不论是 Hyper-Threading 还是其余,采纳传统架构的 CPU 走的都是进步主频的路子,在视频解决时就会遇到一些问题,比方视频压缩的时候会分成 I 帧、P 帧、B 帧,每一帧的算力并不是平均分配的,就会带来对算力需要不稳固的问题。

所以为了让芯片不跑超频,就可能会做一些降频解决,这时候它的算力就可能达不到相应的编码需要。在理论业务中,因为视频业务不是单机运行的,会有很多的服务器集群配合来解决,为了避免 CPU 跑超等简单状况的呈现,就不得不把服务器集群的水位升高,这是传统架构 CPU 比拟大的问题。

然而,Arm 整体的设计是比较稳定的,不论工作有多简单,都能实现稳固输入 ,做到 良好的资源调配和水位调配 ,不必预留很多冗余来避免芯片跑超,这对于 to B 业务来说十分重要。除了主频高以外,传统架构 CPU 的核不多,通常是两个 vCPU/HT 共享一个物理核、1 份 ALU,但 Arm 能够实现 128/256/512 或更多的核,相似 GPU 的设计,如此一来,对于不同利用场景而言,就能够 用少核应答低算力需要的场景 多核应答高算力需要的场景,实现更优的业务调配,升高投入老本。以倚天 710 为例,内含 128 核 CPU,主频 2.75GHz,可适配云的不同利用场景。

与此同时,随着数据上云越来越多,对于数据中心而言,功耗性能也是十分重要的,对运营者来说,低功耗就意味着低成本,除了软件层面的优化以外,倚天 710 能同时兼顾高性能和低功耗

以上因素叠加,就让视频云的头部企业阿里云与倚天 710 的联合看起来瓜熟蒂落。以后,倚天 710 已大规模部署并提供云上服务,依据实际反馈,倚天 710 让阿里云平台的 算力性价比晋升 了超 30%,单位算力 功耗升高 了 60%,这是一个相当大的提高。

摸索一种均衡

纵观视频云产业,人们对体验的极致谋求,将成为视频云继续深耕的能源。在云利用场景下,CPU 的倒退之路将循着算力、I/O、网络协议适配、推理能力、从无到有的发明能力一直演进上来。将来,Arm 会成为视频云中一种重要的架构,整体份额肯定会减少,但不会是惟一的架构,传统架构、异构的 ASIC 和 FPGA 都会有一席之地。而对于 Arm 架构而言,将来的改良方向是 降低功耗、进步算力、做好专用性和通用性的抉择均衡

同时,咱们要意识到,将来视频对算力的挑战是十分高的,简略地靠 CPU 的降级曾经满足不了需要,须要一些非凡的解决,包含越来越多的 AI 算法、专用算法,比方模型搜寻的算法等,再把通用的模块局部地固化在芯片外面,极大地晋升视频解决的效率。

所以在视频云市场,人们总是在做衡量,云芯片厂商要解决好芯片能效和通用性的关系,云服务商要在算力无限的状况下应用很多疾速算法。 而正如阿里云视频云技术负责人所强调的:“咱们的愿景都是一样的,就是让视频普惠各行各业,再反哺视频行业,实现更茁壮的倒退。”

正文完
 0