棋牌评测网浅谈打败人类扑克玩家的机器,亮出你的底牌吧

编辑:棋牌评测吧 发布于2019-06-09 22:16

棋牌评测网浅谈打败人类扑克玩家的机器,亮出你的底牌吧


当计算机在跳棋、国际象棋和围棋比赛中战胜人类时,我没有太过担忧。毕竟,人类打造出一台拥有已知比赛情境的庞大资料库的强大电脑,只是时间早晚的问题。但如今人工智慧居然能在扑克比赛这种不完全资讯博弈中打败职业牌手,我们就必须思考这样一个问题:人工智慧是否已经开始威胁人类创造性的工作岗位?



在比赛的复杂程度(即整个比赛过程中所有可能情形的总和)方面,无限注德州扑克并非人工智慧研究者的最大梦魇。象棋的游戏树有10120个结点。围棋有10170个。双人不限注德州扑克的难度在两者之间,有10160个可能的决策点。有一些办法可以使即时比赛的复杂程度变得可控,这通常需要忽略导致某个特定情形的步骤,以及降低未来决策的计算深度,这些方法已经得到成功实践。



但在扑克比赛中,不完全的资讯增加了比赛的复杂程度。在2017年1月的一篇论文中,马泰•莫拉维西克(Matej Moravcik)与他领导的加拿大和捷克的研究团队,对自己开发的能打败职业扑克玩家的软体DeepStack做了如下描述:



在某一时刻的正确决策,取决于对方所掌握的私人资讯的概率分布,而对手掌握了哪些私人资讯,会通过他们先前的行为暴露出来。不过,对手的行为能否揭示出这些资讯,则取决于他们对我们所掌握的私人资讯的了解,以及我们的行为是否提供了这些资讯的线索。正是因为这种回圈的推理,以至于无法对某个孤立的博弈情形进行判断。而这种孤立的推理正是完全资讯比赛中的本地搜索方法的核心。



换句话说,除非降低比赛的难度水平,否则很难把扑克比赛简化为一个可分析的抽象过程。不过,这两个相互竞争的团队最近似乎解决了这个问题:除了莫拉维西克的团队,还有一个团队来自卡内基梅隆大学。后者尚未发表对其项目的介绍。不过,该团队的成员提供了一些有关他们以往工作的线索。



DeepStack的开发者描述这个软体的语言,正在让所有担心被机器取代的人们感到不安。莫拉维西克和他的团队写道,DeepStack拥有“直觉”——即用“快速的粗略估计”代替精确计算的能力。这台机器通过对大量随机扑克牌局情景的“训练”,培养了这种能力。它的表现足够优秀和稳定,打败了来自17个国家的33名职业选手。



卡内基梅隆大学团队的产品Libratus似乎基于不同的原则,它会在每个牌局的最后阶段采用比初期阶段更加精确的计算方法。它打败了四位顶级的扑克玩家,令他们甘拜下风:这款软体手法变幻莫测,所向披靡。它的技巧之一是不断改变赌注的大小,从而使赢率最大化,即使是最优秀的人类选手也难以模仿。



然而,对于人类来说的好讯息是,即使是研究人员开发出了降低复杂程度的捷径,打败一位优秀的扑克牌手仍然需要大量的计算。曾经在围棋比赛中打败加里•卡斯帕罗夫(Gary Kasparov)的IBM机器人“深蓝”(Deep Blue),是一台拥有32个结点的高效能计算机。Libratus使用了超级电脑的600个运算结点,相当于3330台高配Macbook膝上型电脑。要创造一台能够赢得高难度多人扑克比赛的人工智慧机器,可能需要更多巧妙的办法。



在人工智慧的研究中,千万别说不可能。这个领域正飞速发展,目前的成就在10年前甚至5年前都是难以想象的。但是可以看到,哪怕引入一点不确定性和资讯不对称,都会让人工智慧的研究人员付出加倍的努力,且需要更多资源。扑克虽然很难打好,毕竟有明确的规则。那么在没有规则的博弈中——比如商业谈判,或者最极端的,叙利亚和平谈判程序,要需要多么强大的人工智慧,以及怎样高深莫测的捷径才能成功?人类已经习惯了应付随时更改规则的局面。现有的人工智慧——以及短期之内可以被开发出来的机器——都无法接近于我们处理不确定性和不完全资讯的能力。



机器在消灭常规工作岗位方面扮演着重要角色。从人工智慧领域最近的发展可以看出,人类已经把“常规”的定义扩大到了涵盖大多数有着明确规则的活动。虽然其中一些较为复杂的活动——比如多人扑克比赛——要实现自动化也并不便宜。而对于那些没有明确规则的活动,人工智慧似乎无可奈何。因此为了免受人工智慧的威胁,我们必须找出这样的情形,并学会在这些情形下取胜