关于人工智能:青否交互式数字人的两种互动方式

在理解交互式数字人开始咱们先理解一下 AI 数字人是什么？是利用人工智能技术实现与真人直播形象的 1:1 克隆，即克隆出一个数字化的你本人，包含你的形象、表情、动作和声音都会被克隆下来，让你可能领有靠近真人的表现力。你能够通过咱们的零碎克隆出多个 AI 形象，每个数字人都有独特的共性和格调。无论是批量制作短视频，还是直播 7 *24 小时都能够（🌏：zhibo175）。

第一种形式：

数字人直播的实时互动：数字人直播中公屏问题没有触发到关键词，没有主动回复，就能够应用阿凡达”自主配音玩法：反对真人开麦接管，或者输出文字抉择音色接管，实现你的声音和数字人主播口型 1：1 比对，实时驱动数字人主播在直播间回复。在源码独立部署的厂商中，青否数字人是惟一反对这项技术的。

用户实时交互，真实感满分：后盾设置关键词及回复内容，数字人主播辨认关键词，一对一主动回复。

直播间气氛疏导：新人欢送、关注感激、点赞感激等，反对数字人主播 / 助播画外音 2 种互动形式。

第二种形式：

实时互动数字人抉择终端利用：

AI 数字人接入大模型驱动数字交互，大模型领有跨畛域的常识和语言理解能力，实现问答对话和文学创作等工作。继续从海量文本数据和大规模语法常识中学习进化，实现从提出问题、布局问题到解决问题的全流程闭环利用场景，数字人互动利用星火认知大模型弱小的多任务处理能力, 为各行各业赋能！

数字人的对话流程：用户谈话 –ASR 语音辨认 –NLU 自然语言了解 –DM 对话治理 –NL 自然语言生成 –TTS 文字生成语音 –STV 语音生成视频

接入大模型数字人可能进行学习实时输入问题，能与用户依照流程产生交互，数字人大脑再多语言多情景下进行交互，

智能一体化青否数字人大屏，数字人员工打造沉迷式交互体验：

1. 人脸识别：反对摄像头辨认活体以及人脸，主动唤醒数字人，被动欢送打招呼，晋升交互体验

2. 语音辨认：通过麦克风阵列算法对多路语音进行算法解决。回声打消、声源定向、乐音克制、神经网络降噪等技术

3. 定向收音：半径 1.5M 扇形区域内定向收音，聚焦发音人

实时互动数字人的利用还是很广的，一方面在直播的利用能代替人工主播，缩短工作时长，可能及时回复公屏问题，与用户进行线上交互，也是一种防封伎俩另一方面可能抉择终端进行个场景服务用户，进行问题的答疑及回复，目前互动数字人的技术在倒退，有待开发新的方向，青否数字人的源码开发始终在路上，不断完善和更新，致力于走在市场利用的前端！