很多人比拟感兴趣的一个话题是“数字永生”:即使有一天真人不在了,他也能够通过数字化的形象住在虚构的元宇宙里,依照生前的思维、性情和习惯持续存在、取得永生。声音的数字是基于声音克隆真人的声音进去,让声音永恒活下去!
当然,“数字永生”(数字永生:zhibo175)的想法目前还有点天马行空,模拟人类思维的技术迄今为止仍未呈现。不过,人类的声音却是可能模拟的,而且还有公司曾经打造了可能以假乱真的 AI 零碎。
让歌手的声音“活下去”:AI 能够模拟歌手唱新歌
随着 AI 语音成为娱乐新业务的外围局部,声音克隆技术可能并不算什么新鲜事。
去年,韩国 SM 娱乐联结韩国电信公布了艺人 AI 语音提醒服务,选用了 EXO 伯贤、Red Velvet Joy 和 NCT 泰容等艺人的声音。2 月份的时候,游戏公司 NCSoft 在他们的粉丝社区平台 Universe 开启了虚构通话服务,粉丝们能够通过该服务与他们喜爱的偶像进行(AI 语音)通话。
声音克隆技术能够让观众听到歌手在虚构音乐会期间叫他们的名字,或者能够跟他们说“生日快乐”,寰球的粉丝都能够用本人听得懂的语言收到来自韩国艺人的实在问候。
不可否认,用 AI 模拟真人唱歌的办法是可取的,而且是很有创意的。除了音乐行业之外,游戏业也可能将该技术用于和出名艺人的深度联动,让音乐与游戏重叠用户失去更个性化的体验。
声音克隆 – 音频采集标准:
1、音频时长
无效音频时长 20 分钟,如果带口音,音频倡议不少于 30 分钟;
2、录音筹备
依据不同应用需要,筹备 5000 字左右的文本内容,内容和利用场景(朗诵、直播、日常讲话等)语境相符;
3、录音环境
录音环境宁静,环境底噪小于 40dB,可应用“分贝仪”APP 测试录音环境底噪;
录制时放弃无回音、无混响、无噪声等;
4、录音设施及录音参数
录音设施举荐降噪麦克风 / 小蜜蜂,条件容许倡议应用防风棉衣或防喷罩;举荐应用 48kHz 采样率录制音频;
举荐无损音质格局保留音频,如: wav、fiv、m4a,不能应用压缩格局保留音频,如:mp3;
5、录音人
录音人不宜离麦太近,避免喷麦和录入呼吸声连贯说完一句话;发音清晰、吐字分明,句与句之间断句分明;句与句之间进展 1~2 秒;放弃语境格调统一,防止多种情绪混淆。
将真人声音克隆进去,那就意味着歌手能够用声音的形式“永生”他的声音及歌声持续存在,实现永生的目标!