【DOTA之后新里程碑】DeepMind强化学习重大突破:AI在多人射击游( 十 )
策略、战术、手眼协调和团队合作方面的挑战,吸引了数以百万计的玩家。我们的智能体面临的挑战是
直接从原始像素中学习
以产生操作。这种复杂性使得第一人称多人游戏成为人工智能社区一个非常活跃而且得到许多成果的研究领域。
我们的这项工作关注的游戏是《雷神之锤III竞技场》(我们对其进行了一些美术上的修改,但所有游戏机制保持不变)。《雷神之锤III竞技场》是为许多现代第一人称视频游戏奠定了基础,并吸引了长期以来竞争激烈的电子竞技场面。我们训练智能体作为个体学习和行动,但必须能够与其他智能体或人类组成团队作战。
CTF(Capture The Flag)
的游戏规则很简单,但是动态很复杂。在Quake 3里分成蓝红两队在给定的地图中竞赛。竞赛的目的是将对方的旗子带回来,并且碰触未被移动过的我方旗子,我队就得一分,称作一个 capture。为了获得战术上的优势,他们可以会碰触地方的队员(tagging),把他们送回自己的地盘。在五分钟内capture到最多旗子的队伍获胜。
- 快餐—香酥翅根,学会之后就可以在家做啦,不再担心外面的不卫生
- 强化三头,这2个动作就有很好的效果,并且用了之后都说好
- 大浪淘沙之后 知识付费还走得下去吗
- 健身停止一段时间之后又恢复训练 肌肉会变成什么样?
- 校园贷之后美容贷盯上年轻人 消费者取证难维权难
- 早上起床之后有一个“黄金10分钟”,把握好这10分钟,做好一件事
- 继稻城亚丁、四姑娘山之后 西岭雪山也要出台有偿救援规定
- 心理测试:选择一款美食,测测你10年之后的体重是多少!
- 立秋之后依旧炎热,你需要它才能好好睡觉
- 当诗词文化成为“爆款”之后