关于人工智能:腾讯开悟王者荣耀AI开放研究环境启动申请为学术研究提供探索平台

3次阅读

共计 1636 个字符,预计需要花费 5 分钟才能阅读完成。

11 月 21 日,腾讯“开悟”平台发表正式凋谢“王者光荣 AI 凋谢钻研环境”申请,迈出全面凋谢的第一步。面向非商业用途的机器学习算法钻研,“开悟”平台将提供业界独有的高复杂度 MOBA 训练环境,助力相干学术畛域的前沿摸索。

最新凋谢申请的“王者光荣 AI 凋谢钻研环境”,蕴含了王者光荣 1v1 对战环境与 baseline 算法模型,以后反对 20 位英雄的镜像对战工作以及非镜像类对战工作,尤其适宜钻研竞争性强化学习中的泛化性与通用性问题。

当初,研究者只需在腾讯开悟平台官网注册账号、提交材料并通过平台审核,即可收费下载王者光荣 1v1 测试环境 gamecore,在本地进行 AI 相干钻研测试。

申请地址:https://aiarena.tencent.com/a…

据理解,“王者光荣 AI 凋谢钻研环境”我的项目公布以来受到宽泛关注,往年 9 月以 264 星登上 Github 月度热榜,同时,相干论文已被 AI 畛域的顶级国内学术会议 NeurIPS 2022 接管。

随着王者光荣游戏在继续经营中成长迭代,“开悟”平台也将逐渐摸索并凋谢更多实用于 AI 钻研的游戏测试环境,为 AI 业界面临的“不足高挑战测试环境”难题提供全新解决方案。

高复杂度、高挑战性的智能体训练环境

在王者光荣对战中,单方玩家互为竞争关系,须要收集资源的同时烦扰对方,以达到博得游戏的目标。作为一个具备多英雄、多玩法的简单反抗游戏,王者光荣的状态、动作空间复杂度比围棋等游戏高很多,是学术届钻研简单管制类问题的优质环境。

2019 年,腾讯 AI Lab 首次公布决策智能 AI“王者绝悟”的钻研论文,介绍在王者光荣 1v1 环境中钻研用深度强化学习来为智能体预测游戏动作的办法,该论文被 AAAI 2020 接管,之后“王者绝悟”陆续攻克 5v5 挑战及全英雄池,在学术畛域获得多项成就同时,也为王者光荣玩家带来了“挑战绝悟”等翻新玩法。

同年,王者光荣及腾讯 AI Lab 联手打造“开悟”AI 凋谢钻研平台,打造游戏 AI 产学研新生态。现在“开悟”正式凋谢王者光荣 1v1 环境,并对环境进行了易用性封装,提供规范代码与训练框架,让个人用户在资源容许的状况下能够轻松上手分布式训练。

本次最新凋谢申请的“王者光荣 AI 凋谢钻研环境”在只思考单方英雄抉择条件下,反对 400 种对战子工作,如果算上召唤师技能,将会有 40000 种子工作,这对模型的泛化性有很大挑战,所以尤其适宜钻研竞争性强化学习中的泛化性与通用性问题。

进一步看,钻研模型对不同工作的泛化性,对升高 AI 在不同畛域的利用老本至关重要。例如,面对测试环境中的多个工作,如何在无限的资源和工夫条件下取得最好的成果,这其中的钻研方法论和成绩就能够迁徙到其余畛域,比方机器人不同部位的管制等。

“开悟”AI 凋谢钻研平台:助力产学研共享 AI 新生态

“开悟”是腾讯牵头构建的 AI 多智能体与简单决策凋谢钻研平台,依靠腾讯 AI Lab 和“王者光荣”在算法、算力、试验场景方面的外围劣势,为学术研究人员和算法开发者凋谢的国内当先、国内一流钻研与利用摸索平台。

目前,“开悟”也正在继续助力 AI 学界人才培养。2019 年至今,“开悟”AI 凋谢钻研平台已胜利主办两届“开悟多智能体强化学习大赛”、承办了成都大运会“世界大学生数智竞技邀请赛”AI 赛道,“以赛促研”为国内外青年钻研人才提供测试及晋升 AI 在简单游戏场景下利用程度的机会。

2021 年起,“开悟”先后与北大、清华、中科大等 19 所国内头部高校教师团队联结发动翻新课程合作项目,已于多所高校陆续落地多智能体强化学习实际课程,帮忙学生通过更乏味的形式把握机器学习、强化学习、多智能体决策等要害知识点。

基于“开悟”平台,腾讯将与学界、业界携手,独特利用游戏环境一直晋升 AI 能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等畛域施展更大作用。

附:论文地址

论文链接:https://openreview.net/forum?…
代码链接:https://github.com/tencent-ai…

正文完
 0