德州扑克|国内唯一能打德州扑克的网址曝光,中科院诚意出品,AI在线发牌( 二 )



两人无限注德州扑克一次游戏过程示意
为了教会AI打德州扑克 , 兴军亮带着团队前后用了十多台服务器 , 集中算力 , 让AI不断跟自己打牌 , 20天的时间 , 就打了1亿局左右 。
随后 , 他们又进一步提升了游戏学习的性能 。 这次 , 他们仅用1台服务器 , 训练不到3天 , 就能达到预期水平 。
而在这个过程中 , 参与训练的AI能学会一些类似于人类专业选手才会掌握的计谋 。 而这 , 正是不完美信息博弈最有趣的地方 。 目前 , 兴军亮和团队打造的德州扑克在线人机对抗平台OpenHoldem(http://holdem.ia.ac.cn/) , 目前已经对外开放 。 据兴军亮说 , 这个系统可能是国内唯一能公开打德州扑克的地方 。
当然 , 兴军亮的目标绝不仅仅是带着AI攻略下一款款游戏 。
像不完美信息博弈 , 这种机制 , 在经济政策的制定、法律法规的优化、外交策略的选择等领域 , 都有很广泛的应用 。 这些 , 是国际同行正在努力攻克的 , 也是国内相关研究比较薄弱的 。
去训练出一个更聪明、更有用、可以和人类融为一体的人工智能 , 是兴军亮不懈追求的方向 。