关于语音:语音唤醒真香警告轻松开启与Siri小度和小爱的畅聊

53次阅读

共计 1555 个字符,预计需要花费 4 分钟才能阅读完成。

“Hey Siri,给我讲个故事吧”,这时 Siri 相熟的机械女声从你手机传出,娓娓讲述起一段故事。

“Hey Siri”是 iOS8 中新增加的唤醒 Siri 的形式,不须要任何操作,只须要说 Hey,Siri 就能够轻松被唤醒。

在这一过程中用户不须要用手接触,能够间接用语音进行操作。利用语音唤醒的机制,手机不必实时地处于工作状态,从而实现节俭能耗的目标。


说出“Hey Siri”即可唤醒 Siri

语音唤醒的目标是让智能设施如手机、音箱等,在休眠或锁屏状态下也能检测到用户的唤醒词,让处于休眠状态下的设施间接进入到期待指令状态,开启语音交互第一步。

不同的产品会有不同的唤醒词,例如百度是“小度小度”,小米是“小爱同学”,苏宁是“小 biu 小 biu”,用户须要唤醒设施时即说出特定的唤醒词。

语音唤醒的应用领域非常宽泛,除了手机,智能家居、智能车载等畛域都装备了很多带有语音交互性能的设施,都会须要语音唤醒技术作为人和机器互动的一个开始或入口。

在智能家居畛域,语音唤醒技术最常见利用于智能音箱,例如阿里推出的天猫精灵、喜马拉雅的小雅 Home AI 智能音箱和苏宁的小 biu 智能闹钟音响等。


海尔智家推出的依赖语音唤醒进行管制的全屋智能

同样,海尔智家推出了依赖语唤醒进行管制的全屋智能。回到家后,你只须要召唤“小优小优”,智能音箱就能联动客厅的所有,实现开灯、开空调、关上电视、拉开窗帘等性能。

除了家居畛域,智能车载也成为语音唤醒技术落地利用的另一场景。

自 2018 年以来,本田就与 Sound Hound 单干进行车载语音助手的研发,驾驶员能够通过说出“OK 本田”来将其唤醒,并且它可能依据以后的地位以及以前的所有问题推断出一个问题的上下文。


驾驶者说出“嗨小问”唤醒思皓 E20X 电动汽车零碎

国产汽车同样重视语音唤醒在车载场景的利用。此前,公众旗下思皓品牌推出了 E20X 电动汽车。驾驶者能够向说出“嗨小问”来轻松唤醒零碎,在行驶过程中,人们能够通过语音指令管制导航利用,疾速达到目的地。

语音唤醒获得较好利用成果的决定性因素在于短缺的训练数据集。AI 企业如科大讯飞、百度等均提供了语音唤醒开放平台,通过诉诸丰盛的语音唤醒训练数据集,其产品搭载的语音唤醒技术均获得了长足的倒退。

数据堂自有版权的行业内高标准语音唤醒数据深受器重和好评。从理论的利用场景登程,数据堂研制了《1,000 人唤醒词麦克风采集语音数据》和《998 人远场家居手机麦克风阵列采集语音数据》,为语音唤醒技术更宽泛的落地利用提供助力。

1000 人唤醒词麦克风采集语音数据

该数据在业余录音棚内用高保真麦克风进行采集,录制内容为 20 个各大支流厂商的唤醒词,是一套高质量的近场语音唤醒训练数据。

1000 位被采集者分两批,每 500 人应用 10 个唤醒词,每个词录 10 遍,包含失常速度 6 遍、疾速 2 遍和慢速 2 遍。

第一批次 500 位被采集者的唤醒词为:小度小度;小爱同学;天猫精灵;小艺小艺;你好小艺;小冰小冰;小布小布;小乐小乐;小白小白;小 V 小 V。

第二批次 500 位被采集者的唤醒词为:ok google;hey google;hey siri;alexa;hi siri;hi bixby;ok Emy;叮咚叮咚;小宝小宝;若琪。

998 人远场家居手机麦克风阵列采集语音数据

该数据在实在家居场景下进行采集,录制间隔分为 0.5m、1m、3m、5m,是一套高标准的远场麦克风阵列采集语音数据。

参加录制的 998 人每人录制 20 个唤醒词,每个词反复 10 遍,笼罩失常速度、疾速、慢速。

录制的 20 个唤醒词涵盖了不同规定组成的自定义唤醒词,包含小贝小贝、你好小星、唤醒小朵、我的小胖、小乐在哪儿、小奇进去、小娜醒醒等。

数据堂积淀了十余年的数据处理教训,领有上百套数据标注工具集,通过欠缺的服务流程体系撑持,可能满足不同企业的数据个性化需要。

正文完
 0