关于人工智能:听障人士的有声桥梁百度智能云曦灵AI手语平台发布

45次阅读

共计 2055 个字符,预计需要花费 6 分钟才能阅读完成。

在刚刚闭幕的冰雪赛事中,百度智能云曦灵为央视新闻打造的 AI 手语主播正式上岗,她以晦涩、业余的手语服务实时传递冰雪静止的激情。然而在日常生活中,听障人士想要不便地获取信息仍面临着泛滥艰难,无障碍窗口稀缺的问题亟待解决。

3 月 3 日,百度智能云曦灵正式公布“AI 手语平台”,可实现分钟级生成手语合成视频、手语主播实时直播等能力,为手语服务遍及的难题提出了科技新解法。同时百度智能云曦灵还公布了“AI 手语平台一体机”,能够通过规模化部署疾速建设无障碍窗口,插电即用、操作简略,实用于医院、银行、车站等多种公共场合,缓解无障碍窗口短缺窘境。

百度团体副总裁吴甜示意,人工智能出现交融翻新和升高门槛的新特点,综合使用多技术的数字人带来新体验,AI 加持使数字人制作和经营老本与门槛升高,AI 手语平台将让更多听障人士享受科技带来的便当。

百度团体副总裁吴甜

AI 手语平台 + 一体机 随时随地构建“无障碍窗口”

目前我国听障人士达 2780 万以上,而业余的手语翻译有余 1 万人,微小的需要缺口亟待补足。

在国家公布的《无障碍环境建设“十四五”实施方案》中,明确提出要欠缺无障碍根本公共服务体系、增强信息无障碍服务深度利用。百度智能云曦灵此次公布的“AI 手语平台”及“AI 手语平台一体机”,能够轻松在线上线下不同场景中疾速实现手语翻译服务,助力无障碍环境的建设。

针对线上场景,“AI 手语平台”具备“视频手语合成”、“直播手语合成”、“文本转手语”、“语音转手语”四大性能,可实现一般视频合成为手语视频、实时直播中减少手语画面、文字翻译为手语、语音实时翻译为手语等多种成果。AI 手语平台可搭载在各类 APP、网站、小程序中,让听障人士也能轻松实现线上社交、娱乐休闲、课程学习等各类需要。

对于诸如医院、银行、机场等线下场景,一体化产品的劣势正在逐步放大。百度智能云曦灵此次公布的全离线一体机 V3 以及端云联合一体机 P3,搭载了“AI 手语平台”的外围性能,具备联网即用、开机即用的个性,可实现 AI 手语翻译对线下场景的疾速反对,让“AI 手语平台一体机”像手机、电脑一样可疾速、批量的生产,并渗透到生存的各个角落。

将来通过“AI 手语平台一体机”即可将一般服务窗口间接转换为“无障碍窗口”,听障人士在医院可轻松实现挂号、看诊、缴费、取药等全系列流程,在车站、机场可独立实现值机、托运、改签、直达,在法院、警局等非凡场景中也可对各类紧急情况进行实时平等的沟通。

高可懂度手语表白的背地 \
是技术的翻新与积淀

和传统翻译相比,手语翻译过程更为简单,次要在于手语翻译并非依照日常谈话的程序逐字翻译,而要依据语句意思进行语言精炼和语序调整。手语是真正的小语种,数据量难以撑持训练,各类场景声学环境简单难部署,还须要唇语及表情的配合辅助了解,对 AI 手语平台的构建提出层层挑战。

想实现高可懂度的 AI 手语能力要解决三大技术点:语音辨认的清晰度、手语翻译的准确度、手语动作的晦涩度。在通过开幕式、赛事播报等重重考验,AI 手语主播也印证着“AI 手语平台”已胜利解决这三大难题,以行业当先的全链路 AI 能力实现“听得清”、“翻得准”、“打得好”的手语服务。

首先,在语音辨认清晰度上,百度智能云曦灵 -AI 手语平台通过 SMLTA 语音辨认算法模型,实现声学、语言一体化端到端建模语音辨认,在手机端近场语音识别率可达 98% 以上。百度语音技术部总监高亮示意,基于百度自研的深度学习算法,还可针对诸如游览、医院、司法等不同畛域的词准率进行针对性训练,词准率可达 96%,使得 AI 手语平台一体机更好地利用于不同场景中。

百度语音技术部总监高亮

其次,在手语翻译的准确度及精炼度上,百度人工智能技术委员会主席何中军示意,百度研发了首个基于神经网络的精炼度可控手语翻译模型,并联结手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制订了天然手语标注标准,建设了大规模天然手语翻译语料库,使得模型能够从实在数据中学习手语翻译常识,比方语序的调整、词语的映射以及长度管制等,从而生成合乎听障人群习惯的天然手语。

百度人工智能技术委员会主席何中军

天津理工大学聋人工学院副院长袁甜甜在发布会上分享到,聋人学生更能感同身受,不错过每一个细节。因为工夫紧工作重,学生们还自发呐喊其余各高校近五百名聋人学生共同完成语料库的标注,以责任感和荣誉感为补救社会信息鸿沟做出致力。

天津理工大学聋人工学院副院长袁甜甜

最初,在手语动作的晦涩度上,AI 手语平台通过“动作交融算法”,基于《国家通用手语词典》标准精修近 11000 多个手语动作,让每一个动作的起落之间天然连接,带来真人手语般地连贯性表白。再配合 4D 扫描技术训练,使得 AI 手语数字人表情天然活泼,口型生成准确度高达 98.5%。

无障碍环境建设间接决定着残障人士的生存品质,也是国家及社会文化的标记。百度智能云曦灵“AI 手语平台”及“AI 手语平台一体机“的公布,将疾速解决各类场景中无障碍窗口稀缺的问题,助力社会文化及美好生活的继续构建。

分割购买百度智能云产品或单干可点击“ 浏览原文 ”。

正文完
 0