今年8月在吉隆坡举办的王者荣耀“世界冠军”半决赛的特设环境中,腾讯AI Lab与天美工作室合作开发的战略合作型AI“绝对悟”登场后,在专业选手的5V5对抗游戏中获胜,同年上海ChinaJoy的现场“绝对悟”也是业馀选手1V1
最近,腾讯AI Lab和天美工作室共同发表论文,详细揭露了不败战绩背后的开发故事。
正如研究人员在论文中指出的那样,“王者荣耀”这一实时战略MOBA游戏与传统的棋盘游戏和实时游戏不同,前者需要更加困难的复杂操作,放置的游戏环境也更加复杂。 以“王者荣耀”为例,一局游戏可能涉及10 ̄600种可能的游戏和10 ̄18000可能的游戏操作,这还只是基础,AI需要在MOBA游戏中启动GANK、防御、引导对手、补刀等,而且还涉及复杂的技能
腾讯的研究人员通过系统编码图像特征和游戏状态信息,用数字表示游戏中不同单元和敌人的目标,该框架共运行60万个处理器和1064张显卡(包括NVIDIA Tesla P40s和NVIDIA V100s ) 培训英雄需要48张显卡和18000个处理器核心,系统以每秒80000个样本的速度持续训练。 目前,该系统的训练量相当于人类花费500年积累的经验。
据研究人员说,“绝对悟”经过系统训练80小时后“出师”,实际上经过30小时的训练,“绝对悟”有打败前1%的玩家的能力。 受过完整训练的AI能在0.1秒内做出反应,这已经相当于一流业馀运动员的反应。
在和实际玩家的竞争中,尽管对手是经验丰富的职业选手,“绝对”在比赛中有5人被杀,比赛中死亡的只有1.33个数据。 在今年的ChinaJoy活动现场,“绝悟”全部与现场的玩家进行了2100场比赛1V1的对战,获胜率达到了99.81%。 其中,AI控制的8位英雄中,又有5人获得了100%的胜利率。
腾讯研究人员表示,他们将在不久的将来开放其框架和算法,促进“王者荣耀”等复杂游戏的研究发展。