游戏观察 游戏产业媒体
手机端下载
当前位置:游戏观察 > 新闻 > 行业资讯 > 正文

刚刚草割了围棋圈之后,人工智能下个目标是德州扑克

2017-01-11 11:16 来源:钛媒体

  游戏观察1月11日消息,人工智能程序阿尔法狗(AlphaGo)在前些时候草割了一个个世界知名的围棋大师,让人们再度关注到了人工智能的发展。日前有消息传出,人工智能的下一个目标是德州扑克。

  谷歌旗下DeepMind研发的阿尔法狗(AlphaGo)刚以“Master”的名义战胜了“当今围棋第一人”柯洁,宣告人工智能针对人类的又一轮胜利,引起轩然大波。紧接着,人工智能在扑克游戏中的捷报似乎又已经发出。

  据澎湃新闻报道,来自加拿大和捷克的10位科学家近日在预印本网站arXiv上载了一篇题为《DeepStack:无限注德扑的专业级人工智能玩家》的论文,介绍了一种能在一对一无限注德州扑克中击败人类玩家的新算法DeepStack。

人工智能

  在过去的20年里,我们见证了许多游戏领域在人工智能面前纷纷“沦陷”,比如深蓝攻陷象棋,阿尔法狗60次击败各路围棋选手,而在扑克领域,2008年,来自阿尔伯塔大学的团队也曾对人类挑战成功,不过是在有限制德扑对阵上。

  而之所以在扑克类游戏中,人工智能的进展不大,主要是扑克类游戏的不确定性。而围棋等棋类游戏是完美信息游戏,也就是说,所有玩家在游戏中能获得的确定性信息是对称的。

  在棋类游戏的对阵中,人工智能可以凭借自己的计算优势,看到所有棋盘上的棋子,人类玩家的每一步落棋,都能被人工智能计算出所有的可能性。

  但是,人类生活中还要面临更多非完美信息的情景,正如计算机之父冯·诺依曼所说,“现实世界与此不同,现实世界包含有很多赌注、一些欺骗的战术,还涉及你会思考别人会认为你将做什么。”

  德州扑克就是这样一种包含了欺骗、推测的非完美信息游戏,人工智能并不知道发牌员发出的下一张牌是什么,也不知道对手握的什么牌,只能掌握自己手上的牌,通过这种非对称的信息与对手进行博弈。

德州扑克

  因此,虽然一对一无限注德扑游戏中包含10的160次方个决策点,要少于围棋,但它对人工智能的推理能力提出了更高的要求。在创新工场《人工智能战略展望会》上,创新工场董事长李开复 曾表示:人工智能是人类有史以来最大的领域,将在各个领域产生价值,人类的普通工作一半将被机器取代,而在一些低脑力的工作,甚至90%的工作将会被取代。我们任何的工作如果说不经过,超过五秒钟的思考,都是做不过机器的。

  而当人工智能被培养出了类似人的“直觉”,如今这项有时需要经过50秒思考的游戏,或许也将在人工智能面前失守。

  加拿大和捷克的合作团队开发出了新算法DeepStack。在运用深度学习,反复自我博弈之后,DeepStack学会了在每一个具体情境出现时进行推理。这非常接近人类玩家的“牌感”,即在当前情境下对个人牌面大小的感觉,并作出相应的决策。

  而通过这种“直觉”,DeepStack已经取得了超出人类数十倍的成绩。该团队邀请了来自17个国家的33名专业扑克选手挑战DeepStack,在2016年11月7日到12月12日之间共进行了44852次较量。DeepStack成为了首个在一对一无限注德扑中战胜人类玩家的人工智能,并且平均胜率达到了492mbb/g(milli-big-blinds per game,一般职业玩家认为50mbb/g是个门槛)。转型不是转行,转型走不通的原因是把转型理解成转行了。创新不需要跳到其他的行业去,不一定都要进入新兴行业。创新也不要求大家都去做高科技,都去做云计算、大数据。创新需要企业思考如何采用新技术来提高自己的效率。

  最新游戏行业资讯,点击进入游戏观察!

本网站所收集的资料来源于互联网公开信息或网友自助投稿,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。如果您发现网站上有侵犯您知识产权的资料,请与我们取得联系,本站会在3个工作日内删除。

游戏观察

聚焦极有价值的游戏产业资讯。打造有影响力的游戏产业媒体。

赋能游戏跨端开发,Unity于2021 ChinaJoy推出跨端移植服务