李世|会玩王者荣耀的AI,真的有用么?( 二 )


在比赛中 , 各大高校的教授和学霸们会利用开悟平台研究如何用算法解决单、多智能体解决方案 , 模型结构设计 , 强化学习算法设计、奖励函数设计等问题 。
比赛模式包括1v1墨家机关道、3v3长平攻防战 , 规则与我们玩家在王者荣耀日常接触到的一样 , 最先推倒对方水晶的一方获胜 。
李世|会玩王者荣耀的AI,真的有用么?
文章图片

今年已经是第二届比赛了 , 去年第一届赛程还使用过5v5 梦境大乱斗 , 冠军被中科大收入囊中 。
肯定有差友好奇 , AI 到底怎么经过自我博弈 , 最终学会玩王者荣耀的?
那给大家看看鲁班七号AI 的进化之路 , 我们以训练 10 分钟 , 1小时 , 12小时为节点 , 分别看看 AI 的水平有怎样的变化 。
(下方动图里 , 左上角能看小地图 , 会显示红蓝双方的位置)
这个是训练了 10 min 的 AI , 可以说这时候的 AI 菜得抠脚 , 仿佛完全不知道要做啥 。。。
10min AI ▼
李世|会玩王者荣耀的AI,真的有用么?
文章图片

对战开始 , 红蓝两方的小鲁班 AI 出了塔之后都非常迷茫 , 一脸的 “我是谁?我在哪?” , 兜兜转转瞎溜达 , 技能也在瞎放 。
迷糊了两分钟 , 蓝方的小鲁班才跌跌撞撞走到了兵线附近 。 (左上角能看到红方还在迷茫中 。。。 )
李世|会玩王者荣耀的AI,真的有用么?
文章图片

这时蓝方鲁班发现 , 站在兵线前随意的平A 就可以获得金钱的奖励 。
并且红方一直没出水晶 , 蓝方连 2、3 技能都没按出来 , 就已经锁定胜局 。
李世|会玩王者荣耀的AI,真的有用么?
文章图片

有意思的是 , 这时候鲁班虽然不知道主动进攻 , 却知道抗塔会掉血 , 看来以前经历过不少教训 。
据我猜测 , 通过这一局 AI 就会知道 , 走中间有兵线的地方平 A 就能得到经济 。
那么 AI 经过 1h 的对战训练后 , 水平又如何了呢?
1h AI ▼
李世|会玩王者荣耀的AI,真的有用么?
文章图片

战局一开始 , 红蓝两方都开始跌跌撞撞往中间走 , 看来 AI 已经知道了中间兵线有经济 。
红蓝相见分外眼红 , 直接硬刚 , 蓝方险胜 。
李世|会玩王者荣耀的AI,真的有用么?
文章图片

看来此时 AI 还没学会血量少的时候要苟一下 , 只知道拿下对方人头就可以获得经济 。
训练了 1 小时的 AI 终于知道放特殊技能了 , 可惜技能 2 和技能 3 基本就是瞎按 , 没有一星半点的准头 。。。
李世|会玩王者荣耀的AI,真的有用么?
文章图片

不过相对于 10min 的版本 , 还是有不小的进步~
最终蓝方坚定的在小兵的掩护下推了塔 , 尽管红方也知道守塔 , 显然大势已去 , 无能为力了 。
李世|会玩王者荣耀的AI,真的有用么?
文章图片

那训练了12 小时的 AI 会怎样呢?
对战开始 , 红蓝双方迅速在兵线附近狭路相逢 , 二话不说上来就对喷 。
12h AI ▼
李世|会玩王者荣耀的AI,真的有用么?
文章图片

蓝方因为靠小兵太近 , 中间不小心火力被兵线吸引了一下 , 被红方取得优势 。
这时大家会发现 这时的 AI 已经学会在血量较少的时候后撤 , 可惜在边退边战的时候被喷死了 。
继续观看比赛 , 发现 AI 还学会了在血量少的时候舔血包 , 甚至懂得回家加血!
蓝方鲁班舔血包 ▼
李世|会玩王者荣耀的AI,真的有用么?
文章图片

红方鲁班缺血后回家补血
满血后回来反杀 ▼
李世|会玩王者荣耀的AI,真的有用么?
文章图片

而且 , 鲁班的 2 技能的准确率也直线上升 , 3 技能也知道要在兵线和敌方身前释放 。
李世|会玩王者荣耀的AI,真的有用么?
文章图片

所以 , 虽然看起来这个训练了 12 小时的 AI 动作还是蠢萌蠢萌的 , 跟人类比起来意识也不行 , 可是相比较于只学习了 10 分钟的 AI 强多了 。
这就是强化学习 AI 的厉害之处 , 只要规划合理 , 继续训练就会变得越来越厉害 , 直到无法成长 。