关于人工智能:跳出思维的盒子聊聊-RTE-应用创新大赛的那些作品

6次阅读

共计 1793 个字符,预计需要花费 5 分钟才能阅读完成。

由声网 Agora 与环信联结主办的 “RTE 2021 编程挑战赛” 已圆满闭幕。在往年的大赛中,来自行业中不同畛域的专家参加了决赛评比,包含 Linux 中国技术社区技术负责人 白宦成、声网 Agora 资深 iOS 开发工程师龚宇华、北京音视跳动首席架构师兼讲师 李超、SegmentFault 思否 CTO 祁宁、环信 CTO 赵贵宾、声网 Agora Web 研发工程师 张乾泽、声网 Agora SDK 资深架构师 章真。参赛作品失去了来自不同视角的评估。

咱们也找到了几位评委,跟他们聊了聊他们印象粗浅的翻新利用,以及他们对于将来实时互动场景倒退的认识。

给评委留下深刻印象的作品

往年从 200+ 支参赛队伍中怀才不遇的 46 支队伍加入了决赛。这些作品的创意、技术实现、潜在价值,各具所长,给评委们留下了很深的印象。

例如「都市探险家」我的项目。它是利用地图 LBS + 云信令 SDK + 实时音视频构建的社交产品。通过地理位置,不同的人能够在旅途中找到气味相投的搭档,一起摸索城市。产品中实现了多人语聊房场景,小伙伴们能够通过语音交换。评委祁宁示意“他们将游戏与事实探险联合起来,有比拟良好的应用体验。并且很好的利用了声网的实时通信能力,略微欠缺一下就是一个很有前景的商业我的项目。”

再譬如,在 Web 端实现虚构主播的我的项目「Vchat」。它是应用 tensorflow.js 的 WebGL 引擎作为后端,应用现有开源的人脸识别模型通过摄像头辨认人脸的地位以及五官的状态。再通过 Three.js 和 Vrm.js 将人脸数据实时更新到虚构的 3D 模型上。其实评委之一的张乾泽就曾在 Native 端开发过虚构主播,但这也是他第一次看到有人用 Web 技术和机器学习实现虚构主播,而且骨架还可替换,十分乏味。

还有取得一等奖的「Agora Home AI」以智能家居为主题,评委李超就给出过评估“它将音视频、AI、物联网三者联合到一起,给咱们带来了更多的想像空间,置信这个产品通过更粗疏的打麿肯定能够成为一个景象级的产品”。它应用云信令 SDK 实现了 IoT 设施近程管制。同时,通过声网 Agora RTC SDK 实现人与机器的 1V1 视频,将机器人端采集到的视频发送至 PC 控制中心,进行 AI 智能检测,触发事件响应。

其实给人印象粗浅与否,与是否失去大奖无关,有时我的项目的初衷也能感动人。比方为了听障、视障人士开发的「译音」,评委白宦成认为,咱们这些年的互联网为“健全人”做了很多,但对这些真正须要关注和帮忙人群却做得太少,所以对于这样的我的项目,值得咱们投以更多关注。

RTE 场景后劲远不止于此

〃往年的参赛者提交作品十分踊跃,大部分作品都与社会、生存紧密结合,能看出大家是真正地想解决一些理论问题而开发。〃

——评委祁宁在看过大赛作品后感言

其实,实时互动赛道还有很大的设想空间,例如评委张乾泽就提到了一个间隔大家比拟近的场景,就是游戏与沉迷式音视频。游戏和沉迷式音视频体验交互应该是将来实时音视频的进化方向。以前的实时音视频还停留在“筹备好一个固定的环境,而后大家退出,在设定好的玩法下进行交互”的模式。但未来的模式可能会更强调用户之间的间接交互,由用户间接进行互动和发明玩法,进而获取沉迷式的应用体验,真正地让实时音视频像空气和水一样无处不在。

从未来看,音视频会成为一种根底服务,如何对将它与其它技术更好的联合应该是将来的一大技术方向。评委李超与祁宁都认为,如果围绕实时音视频来看,还有很多场景有待开掘,例如利用实时音视频技术代替繁琐的短信身份认证机制;在面向养老场景上,这次也有很多参赛者开发了作品,但思路还是次要围绕音视频的通话、聊天等,其实还能够从人性化角度思考,做出更多翻新。

当然,评委们也激励大家跳出实时音视频的思维“禁锢”,白宦成就提出了一个想法“大家能够从计算机实现的角度来看,当咱们把所有须要轮询能力实现的我的项目革新成实时的,产品和业务会产生什么样的变动?此外,除了对传统业务实现的革新,还能够是一些数字化场景的退出,这外面的机会很多,就看创业者愿不愿意去抓了。”

实时互动的场景还有很多值得开掘的中央,每一次翻新都有可能让用户的交互体验更沉迷。而实时互动又不只局限于音视频的交互,跳出“思维的盒子”,或者也能开拓出一片新蓝海。如果你有什么想法,也欢送留言与咱们交换。

预报

本届获奖团队将逐个具体分享他们的开发心得,后续将公布在 『声网 Agora 开发者』 公众号,能够扫码关注。

正文完
 0