共计 1079 个字符,预计需要花费 3 分钟才能阅读完成。
耳听为真眼见为实这就话在当今时代曾经不再实用了,只有你的对面是一块屏幕,那外面的内容就很难判断虚实,口型同步技术能够无缝的在视频中插入一个从未呈现过的单词,或者删除任何一句话。
因为放心这种技术会被不道德地应用,斯坦福大学和加州大学伯克利分校的钻研人员共同开发了一个口型同步技术检测工具,用来辨认视频中的虚伪内容。
口型同步技术简直无觉察的批改视频内容
其实,口型同步技术也是在斯坦福大学的 Maneesh Agrawala 的帮忙下开发实现的,这种技术能够让视频编辑简直无奈觉察地批改谈话人的话语。
这个工具对于某些非纪实类的电视节目很有用途,能够通过前期的技术加工来清理或批改内容,从而节省时间和金钱老本,而不须要从新拍摄整个场景。
然而,这项技术也为难以辨认的深度假视频发明了令人担忧的新机会,这些视频制作的目标显著是为了歪曲事实。例如最近美国副总统拜登一则承受采访时睡着的视频广为流传,在人们纷纷质疑拜登的身体状况和精神状态时,视频被证实为伪造的。
检测技术能够辨认 80% 以上虚伪内容
许多伪造的视频都是通过人脸替换,将一个人的脸部特色超过另一个人的脸部特色。只管人脸替换工具简直能够做到以假乱真的境地,但它们绝对毛糙,通常会留下计算机能够检测到的数字或视觉效果。
另一方面,口型同步技术更加奥妙,因而更难被发现。他们解决图像的一个很小的局部,而后合成嘴唇的动作,这些动作与一个人如果说了某些特定的单词,他或她嘴巴真正的动作十分吻合。只有有足够的一个人的形象和声音样本,就能够让视频中的人“说”任何话。
钻研人员首先尝试了一种纯手动的技术,让人类观察者钻研视频的帧。这种办法成果不错,但在实践中既费劲又费时。而后,钻研人员测试了一个基于人工智能的神经网络,这个神经网络的速度要快得多。
为了防止技术被滥用,今年夏天斯坦福大学和加州大学伯克利分校的钻研人员颁布了一种基于人工智能的办法来检测假口型同步技术。这个新程序通过辨认人们收回的声音和嘴的形态之间渺小的不匹配,能够精确地辨认出 80% 以上的造假内容。
真正的挑战是如何从本源打击虚伪信息
通过检测技术辨认虚伪内容治标不治本,真正的工作应该是进步人们的媒介素养,如果有人成心制作和流传错误信息就要承担责任。
比方,拜登那段被批改的视频就不是被技术曝光的,而是因为采访过他的人发现自己的问题被扭转了。当这些工具被无意地用来流传错误信息时,问题就来了。因为许多技巧对一般观众来说是看不见的。
钻研人员说,他们的办法只是“猫捉老鼠”游戏的一部分,随着伪造技术的改良,检测会变得更难。从久远来看,真正的挑战不是打击造假视频,而是打击虚伪信息。