关于视频云:解锁抖音世界杯的画质优化实践

卡塔尔世界杯曾经完结,29天赛程,64场较量,最终梅西率领阿根廷时隔三十六年再次捧杯。世界杯期间,抖音提供的稳固高质直播画面为观众带来了完满的观赛体验,决赛的PCU高达3700W+。世界杯赛事波及链路泛滥,如何保障各链路的画质稳固并进一步晋升画质,是一个微小的挑战。本文次要介绍火山引擎多媒体实验室在世界杯期间画质优化的最佳实际。画质优化链路世界杯波及链路较长,可简化为下图流程,FIFA现场信号首先传到央视端进行合规平安解决,而后通过演播室的制作传输给CDN再进一步散发到用户测。从画质角度来看整个链路可分为画质检测与画质优化两个局部,对于CDN之前的链路以画质监测为主,以发现问题/定位问题/推动对应链路人员解决问题为目标。画质优化在CDN和客户端两侧进行,上面的内容次要介绍画质优化局部。 本次世界杯直播应用反对HDR(高动静范畴)设施录制,团队对反对HDR的设施减少了HDR档位,同时提供了多种不同分辨率/帧率的档位。为了使得观众取得更好的画质体验,团队通过自研的自适应ToneMapping,视频降噪,ROI,端上超分等算法无效地晋升了赛事画质。卡塔尔世界杯采纳HDR拍摄形式,HDR拍摄的片源领有更广的色域,更大的动静范畴。但对很多终端显示设施而言,并不反对HDR信号播放,所以通过ToneMapping算法将HDR信号转换为SDR(规范动静范畴)信号是十分必要的。 相比SDR信号,HDR信号领有更广的色域和更大的动静范畴,在转换到SDR信号的过程中不可避免会产生一些信息损失。罕用的一些ToneMapping办法,不论是Reinhard,Filmic或者Hable,其本质都是设计固定的映射曲线实现从HDR到SDR的转换,同时尽量放弃对HDR成果的还原。但对于世界杯等大型赛事,现场动静范畴跨度极大,场馆的灯光/草地/球员亮度差别显著,观众感兴趣的球员信息理论集中在暗部区域,这就导致ToneMapping之后的SDR信号过暗的问题,为了解决这一问题,团队提出了内容自适应ToneMapping算法,通过统计视频内容的理论光照状况动静地进行ToneMapping,从而失去更优成果。 左: Hable算法,右: 内容自适应ToneMapping 为了兼顾视频码率和主观画质,团队应用了基于LSTM(长短期记忆网络)的时域ROI技术,通过人眼显著性区域检测和编码相结合的形式,让码率在画面上的调配更加正当。目前市面上没有专门针对足球场景的saliency(显著性物体检测)数据集,通用的saliency数据集在世界杯这类特定场景中体现并不现实。针对这一问题,团队专门制作了足球场景的saliency数据集,通过眼动仪追踪球迷观看球赛时的关注区域失去足球比赛的专用saliency数据集,从而极大减少了模型的准确性。针对足球场景中显著性物体较多,显著性区域扩散的特点,团队对检测模型进行了专门的优化,在保障检测速度的前提下,进步了模型的召回率和不同场景的鲁棒性,从而实现更优的主观品质。 注:红色框内示意ROI区域,右边为通用计划后果,左边为优化后果 同时团队应用了视频降噪算法,依据视频信息对其进行空域、时域噪声的去除,将带有噪声的视频解决成洁净、没有噪声的视频。因为去除了视频的噪声,在晋升视频品质的根底上同时升高了传输的码率。因为用户侧网速的限度,端上存在多个档位,当看播端网速较慢时,可能会切换到480P/720P等低分辨档位,此时会触发端上超分算法晋升画面清晰度。超分辨率技术指的是,基于机器学习/深度学习办法,依据视频信息对其进行空域、时域建模重构出缺失的细节,将低分辨率的视频重建出高分辨率视频的技术。这样即便是在低分辨档位也能体验到更清晰的画质。 左:视频降噪前,右:视频降噪后 左:视频超分前,右:视频超分后 除此之外团队还提供大分辨率、高帧率、广色域,并应用色调加强、自适应锐化等多种画质加强技术,出现更加沉迷感的超高清画面。

February 17, 2023 · 1 min · jiezi

关于视频云:Ali266首次商用落地助力优酷码率最高节省40

阿里云自研编码器Ali266于2022年1月在优酷正式上线,这是已知的业界首个H.266/VVC规范的编码器商用落地我的项目。通过两个月的理论运行数据显示,开启Ali266后,等同画面清晰度的状况下比原H.265/HEVC计划码率最高节俭40%,卡顿率升高50%,充分证明了Ali266的商用价值。 这是已知的全世界最快的H.266/VVC编码器Ali266,是阿里云基于最新一代国内视频编码标准H.266/VVC所打造的面向点播、直播、实时通信等不同场景的编解码实现。基于Ali266演变而来的自研H.266/VVC编码器S266在MSU2021(世界编码器大赛)上获得了主观赛道8项第一,主观赛道冠军的优异成绩。从已公开的材料可知,Ali266是目前全世界最快的H.266/VVC实时高清编码器,联合自研的H.266/VVC解码器,即便是中低端手机也可清晰流畅地观看最新的H.266/VVC高清视频。 Ali266首次商用,助力优酷阿里云始终在摸索推动Ali266的商用之路,2022年1月Ali266在优酷正式上线,助力优酷率先用上了国内最新的H.266/VVC视频编解码规范。通过近2个月的理论运行显示,开启Ali266后,等同画面清晰度的状况下比原H.265/HEVC计划码率最高节俭40%,卡顿率升高50%,在老本和用户体验上取得显著收益,充分证明Ali266的商用能力。 阿里云凭借在视频编解码畛域的深耕和积攒,致力于推动H.266/VVC规范的实用化和最新科技成果的普惠化。优酷是中国当先的在线视频平台,现反对PC、电视、挪动三大终端,兼具版权、自制、合制、自频道、直播等多种内容状态,致力于用更丰盛的口碑内容、更极致的视听体验、更翻新的互动玩法。 提供这些利用体验的背地,是一系列非常复杂的技术,其中最外围、最根底的技术之一,就是视频编解码技术。为此,阿里云与优酷团队密切合作,将Ali266首次商用落地,第一工夫上线国内最新公布的新一代视频编解码规范H.266/VVC,让优酷充沛享受视频编解码规范降级带来的技术红利。 H.266/VVC规范的由来说起H.266/VVC规范的由来,不得不提国内上的两大巨头:国际标准化组织及国际电工委员会 ISO/IEC 旗下的动静图像专家组 MPEG(Moving Picture Experts Group) 和国际电信联盟电信规范分局 ITU-T 旗下的视频编码专家组 VCEG(Video Coding Experts Group)。这两大巨头从20世纪90年代初别离公布第一代视频编解码规范MPEG-1和H.261开始,经验了30多年的工夫。大家所熟知的H.264/AVC、H.265/HEVC,都是两大巨头通力合作的成绩。 继2013年公布H.265/HEVC以来,两大国际标准化组织ITU-T和ISO/IEC持续强强联合,于2020年7月公布H.266/VVC的第一个正式版本。如图 1所示,H.266/VVC在包含图像分块、预测、变换、量化、熵编码和环路滤波等环节提供了多项先进的视频编码工具,较上一代H.265/HEVC规范,其压缩率大概进步了一倍。图 1:H.266/VVC底层技术 在叶琰博士的率领下,阿里云从2019年年初开始深度参加制订H.266/VVC规范的制订。历时一年半的工夫共提交了近100篇技术提案,并有多项技术提案失去驳回,为国际标准的制订做出了重要奉献,也为阿里巴巴的业务倒退建设了松软的技术根底。在H.266/VVC的制订过程中,阿里云规范团队成员也负责了多个专题讨论组(AHG)和多个外围试验的负责人,在国际标准舞台上收回中国视频产业界的声音。 Ali266:残缺的H.266/VVC实时高清编解码能力在紧跟H.266/VVC的标准化过程的同时,阿里云也第一工夫启动了Ali266编解码器的开发我的项目,打造残缺的自成一体的编解码能力,更好地关上端到端的生态,为业界提供新一代视频编解码解决方案。 在解码端,Ali266解码器通过多核并行、汇编优化、内存占用和访存效率优化等一系列工程和算法的优化伎俩来进步解码速度。集成Ali266解码器的中低端手机也可清晰流畅地观看最新的H.266/VVC视频或直播,近几年公布的旗舰机型甚至可反对4K@30fps的实时解码。 此外,Ali266解码器在稳定性、鲁棒性、内存占用等方面充分考虑了商业化软件的需要,通过Android、iOS等多款高中低端设施的大规模测试,验证了Ali266解码器的鲁棒性、稳定性和可商用性。 在编码端,为满足不同的业务场景需要,Ali266编码器目前反对slow、medium、fast和faster四大品位。其中,slow品位次要实用于离线利用,编码速度与x265 veryslow品位相当。 在MSU主办的2021年世界编码器大赛中,Ali266 slow品位通过阿里巴巴音视频小组命名为S266,取得了全高清(FullHD)主观性能赛道14项评测指标中的8项第一,4项第二,2项第三;在主观性能赛道,S266更是在寰球16款参赛编码器中以大比分劣势取得第一,在与MSU官网指定的基准编码器x265雷同的主观品质下,带宽节俭高达71%。MSU大赛结果显示,S266是惟一一个所有指标都进入前三的编码器,充分证明了S266在各指标下全面平衡的编码性能。 为了实现H.266/VVC规范的实用化和最新科技成果的普惠化,通过阿里云团队的继续致力,Ali266于2021年6月成为业界首个公开720p实时高清的H.266/VVC编码器,并于同年9月成为业界首个公开1080p实时高清的H.266/VVC编码器。 与x265 medium品位相比,在雷同的品质下,Ali266的faster品位获得的带宽节俭高达40%以上,为直播和视频会议等实时视频利用带来微小的带宽红利。作为第一个实时高清H.266/VVC软件编码器,Ali266在业界走出了重要的一步,证实了现有的算力平台就能够让用户充沛享受到国内最新规范H.266/VVC的弱小压缩能力。 Ali266首次落地优酷背地的技术计划挪动端接入计划优酷播放内核将播放流程高度封装成Consumer、open Source、open Decoder、openRender这几个模块。openSource从网络端拿到原始数据,解复用成音视频es数据并进行缓存治理,Consumer将数据一直的从缓存取出送到openDecoder,并从openDecoder拿到解码后的数据,而后将数据交给openRender渲染以及做相干后处理。他们的大抵关系构造如图 2所示: 图 2:优酷播放器架构及Ali266技术计划 openDecoder与解码器之间的交互如图 3所示。openDecoder会将待解码的数据Send给解码器,而后从解码器Receive解码后的数据,Send和Receive都不block播放流程。解码器外部保护输入输出buffer,Send将数据copy到input packets,worker从input packets拿数据解码,解码后的数据被存入output frames,而后Receive就能拿到无效数据去渲染。 图 3:优酷播放器与Ali266交互细节 优酷播放内核的跨平台、可扩大、高牢靠个性保障了Ali266疾速顺利的在优酷平台上落地。播放内核是native层开发的,具备人造的跨平台个性,所以接入Ali266之后,不须要做太多额定的开发就能够在多个平台迅速公布,这也为Ali266疾速在业务端铺量提供了保障。openDecoder封装了所有解码相干的逻辑,对外只裸露几个简略接口与内核实现逻辑交互,所以要接入Ali266软解码器,只须要实现openDecoder的要害api即可,将解码器与播放器的简单逻辑剥离开来,不便疾速接入新的解码器。播放内核实现了智能平滑丢帧零碎,能够在极其状况下抛弃局部非关键帧从而保障视频画面晦涩播放。借助播放内核欠缺的品质监测零碎,Ali266的线上播放品质失去全面监测和无效保障,使国内最新一代编解码规范在优酷的降级如丝般顺滑。 服务端接入计划优酷转码服务端以后反对不同编码器(H.264/AVC、H.265/HEVC等),不同分辨率(270p到8K),不同帧率(25fps/60fps/120fps等)、不同封装格局(mp4/hls/cmaf等)等上百种组合形式,服务端能够根据端侧播放能力来下发不同的流数据,来保障用户的体验最优。 在优酷转码零碎中,Ali266的接入次要包含编码器接入,解码器接入以及封装格局对H.266/VVC的反对,所波及的模块与转码流程如下图所示: 图 4:Ali266接入优酷服务端模块图 封装层:优酷罕用封装格局次要是MPEG-TS和MP4,服务端在Demux和Mux模块中实现了对H.266/VVC码流封装和解封装的反对。 编解码:通过在转码器中对Ali266Encoder和Ali266Decoder的注册和API调用来实现编码和解码的接入。在生产链路中为了正确探测H.266/VVC码流参数信息,在Demux模块中集成了对H.266/VVC码流的Probe、Parser能力以及Ali266Decoder。 为了使Ali266编码器可能更好的适应优酷利用场景,优酷服务端与阿里云团队相互协作,做了针对性的适配: (1)为了晋升H.266/VVC视频的播放成果,对编码器反对了编码参数信息反复下发能力,保障了用户快进快退和拖拽播放时的体验。(2)为了视频的画质与流畅性,对Ali266Encoder针对性地做了码率管制优化,在保障视频画质的同时,降低码率稳定,将播放端卡顿率相比H.265/HEVC升高了50%。(3)为了适配优酷的智能档多清晰度随带宽平滑切换,在Ali266Encoder中对工夫戳解决进行优化,使得音视频工夫戳与其余格局码流(H.264/AVC、H.265/HEVC)保持一致,确保了优酷智能档无缝自适应切换。(4)实现了优酷现有MP4/MPEG-TS的流媒体封装格局对H.266/VVC规范的反对。因为H.266/VVC规范公布工夫不久,各种媒体解决工具还没有反对对H.266/VVC的封装。为此,优酷开发人员依照MPEG官网文档,在MP4 box与TS的PMT中应用官网定义的CodecId,与播放器配合买通了整个生产播放链路。 除此之外,在生产链路中优酷也针对H.266/VVC做了分辨率-清晰度档位的规格定义,并在播放服务端能够根据端侧反对能力自适应抉择H.266/VVC适合档位的视频流下发,使H.266/VVC编码在优酷生产播放链路上整体落地,并达到了预期的成果。 业内首款H.266/VVC商用落地后果Ali266于2022年1月份在优酷挪动端正式上线,成为目前已知的业界首个H.266的商用落地我的项目。上线后截至3月23日,曾经累计播放超过六十万次。各项指标如下: • 码率:等同清晰度状况下比H.265码率升高高达40%;• 体验:等同状况下卡顿率只有H.265的50%,均匀解码耗时在8ms左右,稳定性超过99.95%;• 功耗:满电可H.266软解播放10小时,节俭流量达到1G;• 内容:涵盖了热门的综艺、电影、电视剧等多种场景,如《古董局中局》、《长津湖》等电影,《麻花特开心》等综艺,《假相》等电视剧。 将来,继续进化Ali266的商用之路据理解,联发科在2021年下半年公布了寰球首款7nm工艺制程打造的电视SoC芯片Pentonic 2000,也是世界首批反对 H.266/VVC视频解码的芯片,具备8K/120Hz的解码能力。这对于欠缺H.266的生态,是个微小的助力。能够说,H.266/VVC不是未来时,而是实实在在进入了当初进行时。 Ali266紧扣最新技术发展趋势,与音视频产业紧密结合,不仅给优酷提供了业界当先的编解码技术,也赋予了业务更多的可能性。为了进一步满足对优酷丰盛的内容状态及业务场景的反对,开掘新技术带来的红利,促成视频产业一直向前倒退,接下来阿里云将会与优酷一起严密单干,针对10bit HDR、优酷自在视角、超高清4K~8K、高帧率60fps~120fps等视频内容,并从点播场景进一步拓展到直播场景,继续继续推动H.266/VVC编解码的技术创新,一直摸索翻新音视频技术,增强其在更多视频利用、更多终端设备上的普适性,将更多的技术普惠到宽广消费者,赋能千行百业的视频化需要,催生新兴产品状态和业务模式,为观众带来更极致的视听体验和更翻新的互动玩法。 「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实际技术文章,在这里与音视频畛域一流工程师交换切磋。公众号后盾回复【技术】可退出阿里云视频云产品技术交换群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。

April 7, 2022 · 1 min · jiezi

关于视频云:AliRTC-开启视频互动-零计算-时代

简介:在 2021 云栖大会《产业视频化翻新与最佳实际》视频云主题论坛中,阿里云智能高级技术专家在《AliRTC 开启视频互动 "零解决" 时代》的主题演讲中,公布了阿里云视频云下一代实时交互解决方案 —RTC “零解决”,同时分享了阿里云视频云在 RTC 产品的摸索和实际,以下为演讲内容整顿。 一、交互演进与挑战在过来几年,视频交互产品产生了什么变动? 咱们认为 RTC 产品对行业产生了两次十分重要的改革。 第一次改革是 2014 年开始的交互从图文到音视频的降级。 2014 年,互联网创业者与 RTC 产品供应商一起摸索视频互动的商业化, 教育、娱乐成为次要的冲破方向, 基于寰球范畴内的互动授课、秀场视频连麦、多人交友互动,也大多在这工夫点实现了商业与技术的胜利联合。 2017 年是一个标志性的工夫点,RTC 产品曾经帮忙头部互联网客户实现了颠覆性倒退,标记着互动视频技术与在线互动商业模式的成熟。 接下来几年更多的是不同体量、不同场景的规模复制,所以咱们能看到,在 2018 年以及后续的几年,市场上并没有新场景、新互动的翻新,而是基于不同内容、不同客群的业务复制, 视频互动从头部走向更多的细分市场。 第二个重要改革产生在 2020 年,受疫情影响,让云视频会议全面浸透,让这个工夫提前了至多 5 年。 这次市场的变动,咱们不能称之为一次技术反动,实际上对 RTC 产品并没有新的诉求,也没有产生新的互动场景和技术,但这次大规模的浸透,从新定义了供应商的市场格局,第一次让云厂商成为了市场极其重要的一部分,让市场从繁多的会议厂商,决裂为云平台 + 会议终端供应商,让咱们的客户有了更多的抉择。 从 2018 年到当初咱们没有场景上的基本冲破,是不是因为咱们的技术上遇到了瓶颈? 带着这样的问题,阿里云对 RTC 场景技术进行了深刻的技术评测,咱们试图发现整个行业大家的技术水位是什么样的,不同于单项的视频技术,RTC 的评测要更为简单。 例如,对视频编码,咱们能够通过 PSNR,SSIM,VMAF 等来剖析,对于视频分类等视觉算法,咱们能够通过 ROC 曲线来剖析,但对视频 RTC 来说,波及的主观感触十分多,是一件比较复杂的事件,目前业界也没有对立的评测规范。 咱们从这些影响用户感触的指标外面抽出六个维度表征 RTC 的体现品质。 对评测感兴趣的话能够关注咱们的「视频云技术」公众号,外面具体介绍了咱们怎么进行自动化评测的,评测过程中咱们会发明不同的网络环境,检测 RTC 在各方面的体现。 咱们对行业里的 RTC 做了一些评测,发现有两个特点。 第一,RTC 有显著的技术门槛,比如说绿色的框代表一类典型的 RTC 能力,由规模较小的团队自研,投入较小,会有显著的差距。 ...

March 22, 2022 · 1 min · jiezi

关于视频云:阿里云视频云-Retina-多媒体-AI-体验馆开张啦

简介:带你体验视频更多可能 带你体验视频更多可能海量视频治理难度大?翻库检索特定人物费时费力?视频内容剪辑效率低?您的得力助手“Retina多媒体AI”体验馆已上线。带你感触视频AI黑科技,开启极致智能体验。 1、智能媒资治理,节俭人力投入Problem 小王负责社交网站短视频业务的经营工作,进行平台视频内容的治理。平台每天会接管用户上传的数万条小视频,这些视频都须要进行内容审核和打标签,以确保视频中没有违规内容,并不便后续的归档治理和视频散发举荐。传统的形式是由平台的审核团队人工来进行内容审核,同时手动给视频录入内容标签。均匀每条视频须要破费3分钟,光是审核打标工作就须要投入约100人的团队来反对。随着视频业务的增长,人力和估算投入就跟不上了。 Solution 有了视频云弱小的视频AI性能帮助,能够帮忙疾速进行智能审核和打标工作,大大节省时间和人力: 应用智能审核能力来审核内容,疾速找出涉黄、暴恐、广告等违规信息,及时警示潜在的危险点,审核人员仅须要大量的复核确认工作即可,能够解放90%以上的人力。应用智能标签性能,可能主动将视频内容标签化,为视频打上类别标签,并具体标记出视频中哪些工夫片段呈现了哪些公众人物、事件、场景、物体等信息,帮忙进行更精准的视频举荐和视频检索。 通过应用视频DNA查重的性能,帮忙平台发现反复上传的视频内容,调整视频的散发举荐策略,防止为用户屡次举荐反复视频,晋升用户的观看体验。2、人物翻库搜寻,疾速下架视频Problem 前阵子劣迹艺人和落马官员新闻频出,作为经营的小王又面临成千上万条视频须要对全网相干视频进行紧急下架问题,没有足够人手来对媒资库内的所有视频进行检索,也没有足够工夫去挨个下架,如何是好? Solution 通过应用视频云多媒体AI的人物搜寻性能,能够在上传入库时即进行特征分析,对视频中呈现的人物进行聚类。一旦须要检索相干人物的视频,能够依据特征分析后果,疾速检索出全副呈现该人物的内容,实现秒级的翻库搜寻速度,高效实现视频紧急下架的工作。 3、视频智能剪辑,晋升制作效率Problem 在视频的剪辑制作过程中,对于视频内容的解决也是非常让人头疼的。小李是一名新媒体视频编辑,每天要花费大量工夫来进行视频内容的制作。他须要从多个综艺节目视频中,剪辑制作出一段明星的混剪短视频,他须要做大量的反复工作: 从几十条视频里一一查找定位明星呈现的片段,作为视频编辑的原始素材再对每一个镜头认真做画面裁剪,去除一些字幕和台标,确保人物处于画面核心选好一段配乐后,还要把每个视频片段和转场对齐音乐节奏再加上视频字幕的编辑、配音如果要公布到手机平台,他还须要进行框选,确保人物不会出框一套操作下来,仅仅半分钟视频成品,小李至多要花上好几个小时。 Solution 应用视频AI的智能检索和智能剪辑技术,视频内容生产将变得更方便快捷。 在搜寻明星的视频素材时,能够依据内容标签疾速搜寻定位到有明星呈现的镜头,具体到视频的具体工夫片段;花式组合检索,人物+动作等,或者依据一张图片或视频查找类似的片段,想要找什么样的视频素材都能够信手拈来;在找到须要剪辑的素材后,如果原始视频素材中有台标、字幕,须要擦除后剪辑新的视频,应用AI性能能够主动对字幕、台标进行检测和去除,还原污浊的视频画面; 应用横屏转竖屏性能,AI能够自动识别主体人物并进行画面裁剪,一键生成竖屏的小视频; 另外,AI能够依据视频的语音主动生成字幕,或者依据剪辑作者输出的文字主动生成旁白配音,不再须要费时费力本人录入配音或敲入字幕;在给视频加音乐配乐时,AI可能帮忙智能辨认歌曲的副歌、节奏点,依据节奏点来智能编排视频和图片的转场工夫,生成动感的卡点视频。这样,一个混剪视频就零打碎敲地实现了,从之前的几个小时,缩短到几分钟,大大晋升了视频剪辑速度。 看到这里,有着同样苦恼的你是否按捺不住想要亲自体验一番了?那就连忙点击http://retina.aliyun.com 原文链接本文为阿里云原创内容,未经容许不得转载。

March 21, 2022 · 1 min · jiezi

关于视频云:揭秘2022冬奥黑科技阿里云视频云Cloud-ME如何实现全息会面

2022北京冬奥会本是一届不凡的存在,这是有史以来第一次将奥运会所需的全副外围零碎全面上云,以数字化技术发明奥运的新纪元。 但绿色奥运不止如此,在面临 Covid-19 限度和物理隔膜之下,千里之外,人与人的会面能够透过绿色科技之光而以全息状态实现,这便是阿里云视频云基于AliRTC(音视频通信技术)推出的云上翻新解决方案——阿里云聚“Alibaba Cloud ME”,第一次在百年奥运史上逾越物理空间,发明了人与人之间的“云聚”时刻。(以下简称Cloud ME) 云聚现场的汩汩之温—Cloud ME发明传奇会面“Cloud ME”本意登程,为物理空间限度下渴望摸索实在会面感的人们,提供沉迷交互体验,使他们可能以真人3D状态见面,并享受彼此的实时对话与交互。 就在冬奥会刚刚揭幕,身处北京闭环内的国际奥委会主席巴赫通过Cloud ME “现身”2022北京新闻核心云聚展区,与远在上海的阿里巴巴团体董事会主席兼CEO张勇,隔空“云聚”,以全息状态同台送出奥运寄语,又在“现场”隔空传递冬奥火炬,于泛滥媒体记者的见证下,Cloud ME让所有交谈和交互犹如真人临于现场,氛围实在而有流动感,惊叹元宇宙的提前到来,又深感科技涌出的汩汩之温。 远隔1300公里的巴赫与张勇学生,以全息状态现身北京新闻核心,同台云拜年。 在奥运世纪见面之外,更有温度的,是透过Cloud ME,让因疫情拆散别北京、上海两地的医护人员家庭得以在“云上全家团圆”,孩子看到父母如临眼前的欢喜之相,和一张穿梭空间的全家福,浓浓暖意,足以霎时消融这背地所有技术的艰苦演进。而这一刻,技术也挥着人文的熠熠之光。 通过Cloud ME,一场特地的见面 整个会面过程通过Cloud ME,将会面者们的全身图像投射到近程全息舱中,以展现他们的3D形象,从而促成多人异地的近程会面交互。 Cloud ME全息舱安装简略,除典型的演播室设施(如摄像机和计算机来捕获镜头)之外,基于弱小的云计算能力,不须要任何额定的现场 IT 基础设施或优化的互联网带宽来助力录制和传输。正是Cloud ME易于落地的个性,让虚拟现实会面能够在更有限的场域向更宽泛的受众凋谢,发明更多样、更有温度的云聚可能。 一张非凡而浓浓暖意的“全家福” 就此,无论多想见的人、多边远的客户、多难相聚的团队,都能透过阿里云视频云的Cloud ME,以云聚之力,咫尺相见。 Cloud ME的魔法浮现—发丝级全息复刻 & 眨眼般超低延时基于阿里巴巴在数字化和智能技术的撑持,Cloud ME制作的音视频将在阿里云上进行压缩、传输、解决和渲染,在这过程中,经久打磨的RTC技术起到最为要害的作用,而阿里云先进的计算能力和宽泛的寰球网络覆盖也为RTC提供了坚实基础。 实现多人异地全息会面,Cloud ME的操作落地简略,但技术非同寻常。 https://www.youku.com/video/X...冬奥黑科技Cloud ME的技术实现 传奇过程,如下所现: 首先,在影像采集环节,摄影机采集的画面是无奈间接在播放端进行全息成像的,所有画面须要通过先进的编码器进行深度压缩,并在实时传输协定和QoS(Quality of Service)抗丢包策略的保障下发送到阿里云的音视频通信(RTC)网络,画面最终上传的格局和尺寸与一般4K电影无异。 随之,当画面达到云端之后,须要借助云上弱小的解决能力实现包含转码、渲染、场景重建、光影解决在内的简单流程,实现从“立体”到“全息”的变质,以真人1:1等比虚拟化复刻,生成3D全息人物,以高清形式重建所有互动细节,包含人物的微面部表情和服装纹理,达到“发丝级”全息全尺寸复刻,塑造全实在交互的沉迷感,所有犹如身临其境。 天下文治,唯快不破。在如此简单和大跨度的技术链路上,为了实现顺畅的会面成果,技术实现的要害也在于“速度”,而保障“速度”的要害则是阿里云笼罩寰球的音视频传输网络GRTN(Global Realtime Transport Network),及其在视频编解码、网络传输、超大规模音视频解决和调度等方面的核心技术。 基于这些技术,影像画面传输和解决的全过程,包含SDK编码、实时传输,云上解决和渲染,端侧解码和成像,仅需在眨眼间的200毫秒内即可实现,体感上与咱们日常交换互动的综合体感雷同,毫无延时顿感,极度实在。 由此,Cloud ME发丝级的全息全尺寸复刻、眨眼般的超低延时,和稳若磐石的网络传输力,让更多交互奇观由而产生。 AliRTC极致技术的普惠之光—“零解决”时代趁势而来Cloud ME的技术实现,外围依靠于阿里云视频云曾提出的AliRTC“零解决”解决方案,即通过“云解决+端渲染”技术,让硬件端只进行简略的采集,传输,播放,同时,所有的简单工作全副集中在云上实现,让终端实现“零解决”。 这是百年奥运史上,第一次利用云上全息RTC技术,实现跨场景近程会面的技术利用,在疫情期彻底突破了物理空间隔膜。通过Cloud ME,可将运动员、赛事工作人员、志愿者和媒体敌人们“瞬移”到指定地点,实时交互沟通。 湖南卫视《新闻大求真》栏目主持人在体验Cloud ME的过程中,就将北京冬奥会现场的志愿者”瞬移“到”节目现场“,进行“面对面”的超级采访,实现了时空同步。来自清华大学的志愿者许雯钧说道:“这感觉就像咱们面对面交换一样!”。 湖南卫视《新闻大求真》栏目对Cloud ME进行现场体验与节目采访 阿里云视频云的 “ Cloud ME” 既能够利用在奥运会场景下,也能够在奥运会之外,向更多参与者和球迷宽泛凋谢,让他们在虚拟现实中体验实在、沉迷、趣味的全息交互,真正开启百年奥运的新内容与新交互。 不仅如此,基于阿里云RTC的寰球部署,还可实现“一地上线,多地同步互动出现”的场景现象,领有“分身不再乏术”的景象级能量。 事实证明,RTC音视频通信是一项有助于世界无效连贯的关键技术。借助阿里云的寰球网络和视频云的智能算法,阿里云视频云旨在将音视频通信能力带入更宽泛的利用场景中,不仅在互动娱乐、智慧教育、视频会议,还有更多更具价值的企业服务和更具想象力的沉迷交互场域。 从图文到音视频,社会的第一次交互改革产生于2014年,而RTC技术在2017年驱动了互动视频技术和在线互动商业的颠覆性倒退。随着5G技术的倒退还会带来新一轮的交互演进,如VR近程合作、虚拟现实互动等。 在云厂商中,阿里云视频云曾率先提出“云解决+端渲染”技术,通过实时通信与云上解决的技术联合,前瞻性地解决了新交互体验因端侧算力受限而无奈实现的虚构交互场景难题,推动终端“零解决”时代趁势而来,而Cloud ME即是阿里云视频云在这一畛域的翻新实际。 ...

February 22, 2022 · 1 min · jiezi

关于视频云:解密优酷智能生产技术看-AI-赋能内容数字化

2021 年,随着社会节奏的放慢,用户碎片化生产工夫一直减少,以后短视频的生产用户规模已超 7.73 亿人,短视频的市场规模超过 2000 亿元。短视频行业倒退迅速,但也存在低质内容泛滥,精品内容稀缺的问题。在 7 月 10 日的 Imagine 阿里云视频云全景翻新峰会上,阿里巴巴娱乐资深算法专家李静,发表了《视频技术再翻新,开启内容数字化浪潮》的主题演讲,从短视频畛域的内容生产窘境登程,分享 MediaAI 平台的技术能力及利用实际,解密优酷短视频智能生产的技术,以下为演讲内容整顿。 优酷如何开启内容数字化浪潮?既然是优酷,就要从长视频、短视频以及最初散发出现进去的所有的视频状态说起。优酷的数字化也会从视频的整个生命周期来剖析。优酷作为一个长视频网站,从长视频最后的拍摄到制作再到实现,咱们有内容评估的数字化零碎。 当一个长视频拍摄进去之后,如何利用这种版权内容再进行二次的创作,这就是创作内容的的数字化;接下来咱们心愿生成一些短视频特效,让用户看起来更好看,更乏味,这是特效的数字化。 最初,在终端上用户拿着手机、平板或者通过电视大屏观看视频的时候如何体验内容数字化的益处? 所以,内容的数字化浪潮要从整个视频的生命周期来讲。 创作因素解构 第一个是内容评估的数字化。在阿里巴巴娱乐有一个北斗星的团队,是专一于做长视频的内容评估,它的外围点是心愿通过后验的数据去掂量整个视频内容的品质,视频内容或者视频的生产元素。 其中又包含一些内涵的货色,例如导演、编剧、演员、剧本等,这些货色是大家平时能听到的,但间隔本人又很边远的货色,这些就是视频内容生产内涵的内容。 内涵之外还有内延信息,包含出现进去视频自身它涵盖的一些人物的信息、镜头的语言以及自身人物的性情等。所有的这些信息都是基于咱们 NLP 语言(Natural Language Processing)或者 CV(Computer Vision)的能力进行解构。 所以当咱们有了内涵信息和对于内容的解构之后,咱们心愿能够通过这些信息去预测用户的心理感触或者对内容的爱好度。 从数据侧取得的先验数据,其中蕴含了十分直观的收视率、用户的互动状态、评论数,咱们心愿通过这些数据能够进一步开掘用户的心理状态、生理状态,以此推动咱们外围能力来实现内容的评估。 内容的评估须要利用到 AI 的能力,一个是 AI 评估,一个是 AI 体检。 什么是 AI 评估? 一个视频片段是否好,以前用人来审,须要破费大量的人力。如果用人工审核预测一部电视剧是否是爆款,会十分十分艰难。所以在内容评估上咱们利用北斗星的零碎,从最开始演员、供应商、IP 等级、导演和编剧的信息预估这部电视剧是什么样的程度。 并且,能够对电视剧里的的演员做进一步更深的剖析,例如他的粉丝价值,整个口碑等。通过剖析咱们让平台进一步做辅助性决策,再利用咱们的 AI 技术最终评估这部电视剧到底是什么品位。 第二个点是 AI 体检。 当视频片段拍完剪辑好之后,用算法来预测这些片段,哪些是看点,哪些是高潮点,哪些是剧情十分拖沓无聊的点,去寻找用户可能弃剧的危险点,给出一些建设性的意见,帮忙剪辑师进行剪辑优化。这是优酷内容评估另外一个利用点。 在长视频之后,就是短视频了。 优酷的《山河令》和《司藤》在放送完结之后,咱们如何进一步利用它做二次的短视频创作? 短视频最近几年来十分火,去年短视频生产用户达 7 亿多人,短视频工会和 MCN 数量超过两万家,市场规模超过两千亿,在如此宏大的短视频消费市场下咱们面临了一些问题,高质量的短视频十分稀缺,大量的低质的、粗制滥造的短视频充斥在整个市场上。 所以,咱们想利用自动化生产的形式代替掉那些品质低劣的短视频,让咱们的智能创作达到人创作的程度,这是优酷想要去做的。 所以阿里巴巴娱乐研发出了概念级的视频的解构能力去赋能智能创作。这是什么呢? 当每次提到视频解构、CV 能力,大家可能都会天然想到一些标签,对于一个视频场景,外面有人物、物体、静止等,在过来 CV 畛域这些是特地主观的标签形容,但进行视频创作的时候,这些货色并不是创作者们十分须要的,创作者们须要的元素或者素材是可能让观众有深切感触的,所以咱们从新定义了语义级的标签,才可能赋能智能创作。 视频解构赋能短视频生产 有了基于概念级的标签解构能力之后咱们能够进行一系列的编辑。 ...

August 24, 2021 · 1 min · jiezi

关于视频云:如何用视频云技术搞一个爆红的-反应视频-项目

2021 年 2 月,“新内容 新交互” 寰球视频云翻新挑战赛启幕。本次大赛由英特尔联结阿里云主办,与优酷策略技术单干,天池平台和阿里云视频云团队独特承办。大赛自开赛以来,吸引了寰球超过 4600 名选手报名参赛,咱们遴选了参赛选手中优良案例和动人故事,一起走进视频云守业创新者的世界。古老又新潮的 “Reaction Video”“Reaction Video”,中文翻译为 “反馈视频”,就是记录下人们对事件做出反馈的视频。在表现形式上,画面由两个局部组成,包含观看的视频资源,以及观看者自己的反馈。 这种视频模式最早起源于上世纪 70 年代的日本综艺节目,这种小窗口模式叫做 「ワイプ(wipe)」,体现嘉宾表情和反馈的 wipe 则被称为 「ワイプ上演(wipe 上演)」。当初不少日本的综艺依然保留这一上演形式,这种「小窗口嘉宾即时反馈」 也成为了日本综艺一大特色。 截图来自日本综艺《月曜夜未央》 2013 年,“反馈视频” 从电视蔓延到了互联网,随着美剧《权力的游戏》第三季热播,大量的油管网友录制了看剧时的强烈反馈,引发了寰球观众的个体共鸣,“反馈视频” 由此红遍寰球,并在多个视频平台倒退成了成熟且宏大的分支。油管上最火的 Reaction 类频道,目前已累积 110 亿次播放量,领有 2010 万订阅粉丝。 随着在寰球的爆红,“反馈视频” 开始在国内视频平台扎根,并倒退出了 “本土化” 趋势。目前 B 站是国内 Reaction 内容最多的平台,其中 “蚊叽叽” 是做 Reaction 视频较早的一批 up 主,从 2018 年 1 月份开始公布第一期 Reaction 视频,截止目前粉丝数曾经达到 54.8 万。 图片截取自 bilibili “反馈视频”,存在即正当在 “反馈视频” 爆火的同时,也有人开始质疑这种视频模式真的有价值吗?会不会只是热点加持下的过眼云烟呢。 对于这点,让咱们先看看视频平台的倒退历史,晚期的视频平台只提供了文字评论性能,观众在观看视频后,能够在视频下方留下评论,再起初由评论进化的 “弹幕” 大行其道,当初简直成为了所有视频平台的标配。 在评论和弹幕的背地,暗藏的是观众群体所需的认同感和分享欲。在可预感的将来,随着视频云技术的遍及,“反馈视频” 这种更加活泼的互动模式势必会被广泛应用,观众在观看视频的同时,就能够实时记录下本人的即时反馈,兴许会成为一个新的赛道。 “反馈视频”,怎么用视频云技术实现?在本次的寰球视频云翻新挑战赛中,就有选手关注到了这个乏味的互动模式。选手刘劭荣是一名老成持重的程序员,工作之余他十分喜爱看 “反馈视频”,他发现制作一支 “反馈视频” 并不容易,须要消耗很多的工夫剪辑制作,对观众来说,一支 “反馈视频” 也只能看到固定一个人或几个人的反馈。所以他决定从 “反馈视频” 的角度切入,开发一个不同凡响的视频利用。 ...

June 22, 2021 · 1 min · jiezi