人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊

中新网客户端北京7月15日电(采访人员 宋宇晟)“整体的感觉就是AI太猛了 , 它们总是能做出异于常人的反应……”
在1:3输给人工智能后 , 有王者荣耀电竞职业选手这样说到自己对战时的感受 。
此后更有网友在社交媒体直言 , “人类连玩游戏也打不过AI了”“人类再次一败涂地”……
那么 , 让人工智能去玩《王者荣耀》就是为了“虐菜”吗?中新网采访人员最近和该AI模型负责人聊了聊 。
人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
3:1 “属于正常发挥”
几天前 , 在世界人工智能大会现场 , 一款名为“绝悟”的游戏AI与五位来自王者荣耀职业联赛的选手现场进行了一场表演赛 。
有报道指出 , 人工智能在比赛中相继打出了“蹲草”“前后拉扯输出”“辅助开团”等操作 , 并在团队合作上颇具专业意识 。
在这场五局三胜的赛事中 , 人工智能以3:1的比分战胜了五位职业选手 。
尽管胜负成绩成了关注这场比赛的网友讨论的热点话题 , 但王者绝悟AI模型负责人邱福浩却告诉采访人员 , 团队对比赛的胜负没有预期 。
作为研发人员 , 他们更希望人工智能可以把握与高水平玩家切磋的机会 , 验证能力并不断成长 , 虽然这样的成绩“属于正常发挥” 。
人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
此外 , 很多网友猜测 , 相较于人类职业选手的反应速度 , 人工智能或许在操作方面有着“绝对优势” 。
然而 , 邱福浩却向采访人员明确表示 , 在数值和操作上 , 王者绝悟AI并没有独特的优势 , 在游戏中的客观条件限制是一致的 。
“在英雄的自身状态参数上 , AI并没有额外的加成 , 与人类玩家相同;AI在视野观测上与人类玩家保持一致 , 对于战争迷雾中的不可见单位 , AI同样也看不到;AI的操作反应也做了客观限制 , 其反应分布和均值与KPL职业选手是相接近的 。 根据实际观察 , 人类玩露娜等英雄会比AI更秀 。 ”
人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
AI一天对局数≈人类440年
既然客观条件没有什么不同 , 人工智能为何能战胜人类职业选手?
邱福浩给出的答案是训练量 。 “AI的优势在于其庞大的训练量 , 一天对局数约等于人类440年 。 ”
用研发团队的话说 , 自2017年启动项目 , 王者绝悟AI从模仿人类的监督学习 , 到自我博弈的强化学习 , 经过了多次迭代 , 攻克了多个难题 , 才逐步进化成了全英雄职业电竞水平的“完全体” 。
邱福浩介绍 , 2018年 , 王者绝悟AI还只是顶尖业余玩家的水平;到了2019年 , 王者绝悟AI不再需要模仿人类数据 , 而是通过自己和自己对战 , 进一步提升微操水平和大局观 , 已达到了王者荣耀职业电竞水平;去年 , 它学会了更多英雄玩法 , 并用40个英雄首次接受玩家们的挑战;最新版本中 , 团队又在竞技比赛的局前和局内阶段 , 进行了针对性优化 。
人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

资料图:2016年的围棋人机大战 。
几年前 , AlphaGO击败人类职业围棋选手时 , 一度震惊世界 。
与围棋相比 , 《王者荣耀》是一个不完全信息博弈场景 , 需要多个AI协作完成任务 , 且需在复杂连续的决策空间下进行长期决策 。
换句话说 , 教会人工智能玩《王者荣耀》 , 比让人工智能下围棋更难 。
邱福浩说 , 围棋的动作空间多达10的172次方 , 而AI在王者荣耀一局游戏中的操作可能性则多达10的20000次方 。
人工智能|为何让人工智能玩《王者荣耀》,我们和研发团队聊了聊
文章图片

比赛现场 。 受访者供图
让AI打游戏不是终点
但 , 进行如此复杂的研发、训练 , 就只是为了让人工智能在游戏中打败人类吗?
邱福浩并不这么看 。 因为人工智能最终是要服务于人类的 。
他告诉采访人员 , 团队之所以就此进行研发 , 首先是因为“这是一个多人协作的游戏场景 , 它在设计上的高复杂度、高挑战性 , 满足了对高水平AI+游戏的研究需要” 。
“从近年AI发展的关键事件可以看到 , AI的下一个里程碑很有可能就是在复杂策略游戏中诞生 。 ”