关于人工智能:青否交互式数字人的两种互动方式

在理解交互式数字人开始咱们先理解一下AI数字人是什么？是利用人工智能技术实现与真人直播形象的1:1克隆，即克隆出一个数字化的你本人，包含你的形象、表情、动作和声音都会被克隆下来，让你可能领有靠近真人的表现力。你能够通过咱们的零碎克隆出多个AI形象，每个数字人都有独特的共性和格调。无论是批量制作短视频，还是直播7*24小时都能够（：zhibo175）。

第一种形式：

数字人直播的实时互动：数字人直播中公屏问题没有触发到关键词，没有主动回复，就能够应用阿凡达”自主配音玩法：反对真人开麦接管，或者输出文字抉择音色接管，实现你的声音和数字人主播口型1：1比对，实时驱动数字人主播在直播间回复。在源码独立部署的厂商中，青否数字人是惟一反对这项技术的。

用户实时交互，真实感满分：后盾设置关键词及回复内容，数字人主播辨认关键词，一对一主动回复。

直播间气氛疏导：新人欢送、关注感激、点赞感激等，反对数字人主播/助播画外音2种互动形式。

第二种形式：

实时互动数字人抉择终端利用：

AI数字人接入大模型驱动数字交互，大模型领有跨畛域的常识和语言理解能力，实现问答对话和文学创作等工作。继续从海量文本数据和大规模语法常识中学习进化，实现从提出问题、布局问题到解决问题的全流程闭环利用场景，数字人互动利用星火认知大模型弱小的多任务处理能力, 为各行各业赋能！

数字人的对话流程：用户谈话--ASR语音辨认--NLU自然语言了解--DM对话治理--NL自然语言生成--TTS文字生成语音--STV语音生成视频

接入大模型数字人可能进行学习实时输入问题，能与用户依照流程产生交互，数字人大脑再多语言多情景下进行交互，

智能一体化青否数字人大屏，数字人员工打造沉迷式交互体验：

1.人脸识别：反对摄像头辨认活体以及人脸，主动唤醒数字人，被动欢送打招呼，晋升交互体验

2.语音辨认：通过麦克风阵列算法对多路语音进行算法解决。回声打消、声源定向、乐音克制、神经网络降噪等技术

3.定向收音：半径1.5M扇形区域内定向收音，聚焦发音人

实时互动数字人的利用还是很广的，一方面在直播的利用能代替人工主播，缩短工作时长，可能及时回复公屏问题，与用户进行线上交互，也是一种防封伎俩另一方面可能抉择终端进行个场景服务用户，进行问题的答疑及回复，目前互动数字人的技术在倒退，有待开发新的方向，青否数字人的源码开发始终在路上，不断完善和更新，致力于走在市场利用的前端！