关于神经网络:MoViNets系列模型手机端实时分类视频的好帮手

42次阅读

共计 597 个字符，预计需要花费 2 分钟才能阅读完成。

须要视频了解，然而嫌模型太重、耗时太久？轻量动作辨认模型再次降级，由谷歌研究院在 2021 年提出的 MoViNets 系列可能更加高效地在现推理流媒体视频，并反对施行分类挪动设施端捕捉的视频流。MoViNets 在视频动作辨认的通用数据集 Kinetics、Moments in Tme 和 Charades 上均取得了先进的精度和效率，证实了其高效性和宽泛适用性。

|MoViNets: Streaming Evaluation vs. Multi-Clip

EvaluationMoViNets 是一个卷积神经网络系列，对 2D 视频分类器和 3D 视频分类器舍短取长，兼容它们的要害劣势，并加重各自的局限性。该系列模型通过神经构造搜寻取得丰盛的高效视频网络结构，援用流缓冲技术使得 3D 卷积可能承受任意长度的流视频序列，再简略地集成多个模型用于进步精度，最终无效地均衡计算量、内存开销、精度。

相干材料：
模型用例：action-classification/movinet
论文：MoViNets: Mobile Video Networks for Efficient Video Recognition
更多材料：MoViNets：让实时视频了解成为事实

更多我的项目更新及具体内容请关注咱们的我的项目 (https://github.com/towhee-io/…)，您的关注是咱们用爱发电的弱小能源，欢送 star, fork, slack 三连 :)

正文完