关于神经网络:MoViNets系列模型手机端实时分类视频的好帮手

5次阅读

共计 597 个字符,预计需要花费 2 分钟才能阅读完成。

须要视频了解,然而嫌模型太重、耗时太久?轻量动作辨认模型再次降级,由谷歌研究院在 2021 年提出的 MoViNets 系列可能更加高效地在现推理流媒体视频,并反对施行分类挪动设施端捕捉的视频流。MoViNets 在视频动作辨认的通用数据集 Kinetics、Moments in Tme 和 Charades 上均取得了先进的精度和效率,证实了其高效性和宽泛适用性。

|MoViNets: Streaming Evaluation vs. Multi-Clip

EvaluationMoViNets 是一个卷积神经网络系列,对 2D 视频分类器和 3D 视频分类器舍短取长,兼容它们的要害劣势,并加重各自的局限性。该系列模型通过神经构造搜寻取得丰盛的高效视频网络结构,援用流缓冲技术使得 3D 卷积可能承受任意长度的流视频序列,再简略地集成多个模型用于进步精度,最终无效地均衡计算量、内存开销、精度。

相干材料:
模型用例:action-classification/movinet
论文:MoViNets: Mobile Video Networks for Efficient Video Recognition
更多材料:MoViNets:让实时视频了解成为事实


更多我的项目更新及具体内容请关注咱们的我的项目 (https://github.com/towhee-io/…),您的关注是咱们用爱发电的弱小能源,欢送 star, fork, slack 三连 :)

正文完
 0