关于云计算:编解码持续升级硬实力铸就视频云最优解

算力时代,视频云须要怎么的CPU?

在数据爆发式增长及算法日益精进的大背景下,属于「算力」的时代俨然到来。随着视频成为互联网流量的配角,日趋饱和的音视频场景渗透率、人类对“感官之限”的谋求与冲破、更多元化的场景摸索及技术需要,为视频编码能力和底层算力及硬件反对带来更大的挑战。

“视频云作为音视频行业的基础设施,能极大地简化视频从采集、解决、编码、传输到散发的全链路流程。”正如阿里云视频云技术负责人在《芯事》访谈中所提到的,阿里云视频云与倚天710一起,正在踏上视频普惠千行百业的新征程。

点击链接查看视频:https://www.eefocus.com/video/1462707.html

视频云与倚天710的联合

2022年北京冬奥会,阿里云承接了一项重要的工作,那就是撑持冬奥全面上云。为此,阿里云视频云推出了全新的云上翻新解决方案——阿里云聚“Alibaba Cloud ME”,这也是寰球第一次在奥运会上实现异地全息会面,是一次突破时空之距的革命性翻新。在感叹云上沉迷之旅的精妙之余,咱们不禁要问,阿里云视频云上路即狂奔的硬实力是什么?除了使命必达的奋斗精力和弱小的软件、算法撑持能力以外,阿里云视频云技术负责人致凡还提到了倚天710

当咱们将眼光投射到倚天710上,会发现它诞生于2021年,是一款由平头哥自研的云芯片,通过一年多工夫的硬件部署和业务验证,倚天710实例已胜利利用到阿里巴巴团体的外围业务中,并服务多家出名互联网及科技公司。正是基于后期低劣的体现,倚天710已在阿里云数据中心部署,将来部署规模将持续扩充。

当然,没有一款芯片生来就如此弱小,视频云技术负责人谈到:“视频云和倚天710的联合是一段美妙的旅程,但两头还是经验了十分多的事件。”

回忆起这段旅程:“因为视频业务的增长速度是十分快的,研制一颗芯片的周期也十分长,不论是芯片研发、还是芯片落地后适配视频云业务成长,都是极具挑战的,但咱们一起做好了正视挑战、冲破壁垒的筹备。当第一版芯片流片回来后,芯片根本性能体现稳固,且因为Arm架构带来的原生劣势,再加上阿里云战争头哥的同学单方坐在一起,在理解芯片外部形成的根底下来做了很多算法调优后,可能让代码在芯片上跑得更快。

同时,倚天710还针对特定算法场景进行了指令集减速与优化,比方像SVE等矢量计算技术,其中BF16/INT8 mmla指令可实现高效的矩阵乘法运算,还反对Hash、CRC32等减速指令,能够让单条指令并行处理更多数据,大幅晋升视频编解码、AI编解码加强等场景性能,这是一个两边一起迭代的过程。”

所以,从最早的性能挑战传统架构CPU,到当初曾经远远超过传统架构CPU,倚天710的“变质”是一步一个脚印走过去的。视频云技术负责人认为:“这是一个十分好的案例,阿里云视频云的业务跟平头哥的芯片设计可能完满地联合在一起,利用各自的劣势让芯片设计进去,在视频行业中施展更大的作用。”

谈起平头哥和阿里云视频云业务的这次单干,就不能不提到一个大的产业背景,即视频云的爆发式增长。至于什么是视频云?“视频云就像是音视频行业的水和电,是底层的基础设施,能够大大简化视频从采集、解决、编码、传输到散发的链路。”这个比喻再失当不过。

社会视频化在狂飙

从2017年开始,短视频的热度持续上升,加上近三年疫情下直播、视频会议、线上教学等畛域的崛起,社会视频化成为一种大趋势。依据CNNIC公布的第50次《中国互联网络倒退情况统计报告》数据显示,截至2022年6月,我国挪动互联网接入流量达1241亿GB,同比增长20.2%;另依据思科公布的数据显示,视频内容约占互联网总流量的90%,占挪动网络总流量的64%。

联合这两组数据,咱们能够得出视频正在成为互联网流量的配角,而爆炸性的数据量又将会对算力和存储提出更大的挑战。于是视频云的价值被凸显进去,并呈现出了一种不可逆的倒退态势。在这样的大背景下,寰球以互联网公司为主的科技企业纷纷转型,开启视频云技术的探索之旅,并在安防监控、近程医疗、批发电商以及金融机构等典型场景中失去落地

以后,视频云产业曾经造成了绝对稳固的头部战队,包含微软、AWS、阿里云等支流云厂商。对于国内视频云的市场体量方面,依据IDC公布的数据显示,2022上半年中国视频云市场规模达到50.5亿美元,同比增长15.7%,预计到2026年,市场规模靠近300亿美元。值得一提的是,通过报告显示,阿里云视频云间断5年占据中国视频云整体市场份额第一,并且渗透率还在一直攀升。

视频产业倒逼技术迭代

对于视频云产业来讲,以在线视频为例,从最早国外的Livestream、国内的斗鱼直播到当初,曾经经验了25年的历史,其实从技术的角度来看,整个行业倒退的速度没有设想中的快。比方,视频编码从H.264到H.265,再到H.266,均匀10年降级一代。为什么速度不是很快?因为它要解决的问题比拟多:算力、网络传输、规范等等。然而,咱们看到明天的视频产业倒退十分迅猛,这也倒逼技术要去实现疾速迭代。这几年曾经初显成果,比方当初编码器的降级迭代速度是5年,以前是10年,预计前面可能是3年。

为什么这里要强调编码?事实上,视频云是一个算力密集型行业,视频信息量很大,如果采纳和文本、图片一样的压缩模式,那么还原度是不够的,所以视频必须进行编码解决。编码要是做不好,不仅会损失视频品质,还会带来传输难度高的问题。从MPEG2开始,每一代视频编码的降级,其压缩率大概能够晋升50%,远低于视频分辨率每更新一代晋升4倍的速度,即便这样,每一代降级对CPU算力的需要,以及算法复杂度都会进步至多10倍以上,这对芯片的架构、芯片底层的指令集优化、芯片的存储器和cache构造都会带来新的挑战,很多外围的算法要用新的指令集从新写一遍,这意味着视频编码和芯片成长是须要同步的

视频云须要怎么的CPU?

通过后面的介绍,咱们理解到视频编码对算力的要求很高,因为咱们经常试图用算力换存储,用算力换传输带宽,所以咱们心愿算力越高越好。

那么如何晋升CPU的算力?首先要抉择好的内核架构。在视频畛域,传统架构曾经有三十几年的历史了,目前市占率仍然能达到90%以上的份额,但裹挟着惨重的向后兼容包袱。而Arm作为一种精简指令集,不仅没有历史包袱,还能够依据需要减少很多寄存器,同时从内存cache构造的设计和指令集的设计下面,可能更贴合须要大算力的视频解决需要。此外,不论是Hyper-Threading还是其余,采纳传统架构的CPU走的都是进步主频的路子,在视频解决时就会遇到一些问题,比方视频压缩的时候会分成I帧、P帧、B帧,每一帧的算力并不是平均分配的,就会带来对算力需要不稳固的问题。

所以为了让芯片不跑超频,就可能会做一些降频解决,这时候它的算力就可能达不到相应的编码需要。在理论业务中,因为视频业务不是单机运行的,会有很多的服务器集群配合来解决,为了避免CPU跑超等简单状况的呈现,就不得不把服务器集群的水位升高,这是传统架构CPU比拟大的问题。

然而,Arm整体的设计是比较稳定的,不论工作有多简单,都能实现稳固输入,做到良好的资源调配和水位调配,不必预留很多冗余来避免芯片跑超,这对于to B业务来说十分重要。除了主频高以外,传统架构CPU的核不多,通常是两个vCPU/HT共享一个物理核、1份ALU,但Arm能够实现128/256/512或更多的核,相似GPU的设计,如此一来,对于不同利用场景而言,就能够用少核应答低算力需要的场景多核应答高算力需要的场景,实现更优的业务调配,升高投入老本。以倚天710为例,内含128核CPU,主频2.75GHz,可适配云的不同利用场景。

与此同时,随着数据上云越来越多,对于数据中心而言,功耗性能也是十分重要的,对运营者来说,低功耗就意味着低成本,除了软件层面的优化以外,倚天710能同时兼顾高性能和低功耗

以上因素叠加,就让视频云的头部企业阿里云与倚天710的联合看起来瓜熟蒂落。以后,倚天710已大规模部署并提供云上服务,依据实际反馈,倚天710让阿里云平台的算力性价比晋升了超30%,单位算力功耗升高了60%,这是一个相当大的提高。

摸索一种均衡

纵观视频云产业,人们对体验的极致谋求,将成为视频云继续深耕的能源。在云利用场景下,CPU的倒退之路将循着算力、I/O、网络协议适配、推理能力、从无到有的发明能力一直演进上来。将来,Arm会成为视频云中一种重要的架构,整体份额肯定会减少,但不会是惟一的架构,传统架构、异构的ASIC和FPGA都会有一席之地。而对于Arm架构而言,将来的改良方向是降低功耗、进步算力、做好专用性和通用性的抉择均衡

同时,咱们要意识到,将来视频对算力的挑战是十分高的,简略地靠CPU的降级曾经满足不了需要,须要一些非凡的解决,包含越来越多的AI算法、专用算法,比方模型搜寻的算法等,再把通用的模块局部地固化在芯片外面,极大地晋升视频解决的效率。

所以在视频云市场,人们总是在做衡量,云芯片厂商要解决好芯片能效和通用性的关系,云服务商要在算力无限的状况下应用很多疾速算法。 而正如阿里云视频云技术负责人所强调的:“咱们的愿景都是一样的,就是让视频普惠各行各业,再反哺视频行业,实现更茁壮的倒退。”

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理