外媒称,美国《科学》周刊11日发表的一项研究显示,由脸书公司和美国卡内基-梅隆大学共同研发的人工智能(AI)系统“Pluribus”在六人制德州扑克比赛中击败了5名职业选手。
据埃菲社7月11日报道,这是当前唯一一个在多人比赛中表现胜过人类扑克选手的AI系统。在此之前,在扑克比赛中击败人类是少数AI未能完成的挑战之一。
报道称,对于AI系统而言,扑克具有诸如国际象棋等其他游戏不具备的难点,那就是“信息不对称”:由于桌面上的一些牌始终背面朝上,玩家只能了解游戏进程的一部分。因此,想要获胜就必须理解和猜测其他玩家的行为,这其中包括辨别对手什么时候是在虚张声势以及自己通过虚张声势的做法欺骗对手。
在实验中,该研究报告作者图奥马斯·桑德霍尔姆和诺姆·布朗采用“行动抽象”和“信息抽象”技术,减少AI在一局游戏中需要考虑的行动。
据他们介绍,强化学习系统和新算法的结合是机器能够战胜人类的关键。这款由他们与脸书共同研发的名为“Pluribus”的AI系统,在一次又一次与自身副本的对抗中学会了如何在六人制无限制德州扑克比赛中获胜。
在与副本进行游戏的过程中,该AI系统生成了一套既定策略,科学家们称之为“行动计划”。而在与真实的对手比赛时,Pluribus会通过寻找其他对于应对当局游戏而言更有效的即时行动来改进这套既定策略。
事实上,Pluribus的算法做出的一些反馈甚至让它的开发者感到惊讶。大多数职业扑克选手会避免一种明显不合逻辑的下注方式(在术语中被称作“驴式下注”),其唯一的目的是扰乱在游戏中居主导地位的玩家。然而,Pluribus会相对频繁地使用这种下注方式。被它击败的职业选手之一达伦·伊莱亚斯说:“AI最强的地方在于它运用混合策略的能力。我们人类选手也想做同样的事,但我们在执行上存在问题。以完全随机的方式持续进行这种操作非常难。”
桑德霍尔姆指出,在此之前,在战略思维方面超越人类的AI所取得的重大成就仅限于二人对决,但在如此复杂的游戏中击败5名玩家的能力为利用AI解决现实世界中各种各样的问题提供了新机会。(编译/苏佳维)