新闻 资讯 金融 知识 财经 理财 科技 金融 经济 产品 系统 连接 科技 聚焦
首页 > 新闻 > 人工智能 > > 正文

谷歌DeepMind超级进化:国际象棋、围棋吊打世界冠军

2018-12-07 11:16:26来源:新浪科技

北京时间12月7日早间消息,Alphabet旗下人工智能部门DeepMind一年前宣布开发了一套名为AlphaZero的系统,它可以教会自己如何掌握国际象棋、日本将棋和中国围棋,而且都能击败世界冠军。

虽然DeepMind的说法令人印象深刻,但当时却未能通过同行评审。不过,DeepMind今天宣布,经过数月的反复修订,该公司在AlphaZero上的成果已经被《科学》杂志接受,并登上该杂志的首页。

“几年前,我们的AlphaGo以4:1击败了18次获得围棋世界冠军的棋手李世石。但对于我们来说,这实际上是构建一个通用学习系统的开始,这个系统可以自己学习不同的游戏,最终达到超越人类的水平。“AlphaZero的首席研究员大卫·西尔沃(David Silver)对参加蒙特利尔NeurIPS 2018大会的记者说,“AlphaZero是这一段旅程的下一步。它从头开始学习击败围棋、国际象棋和日本将棋的世界冠军。除了游戏规则外,它什么知识都没有。“

Silver解释说,选择这些游戏既考虑了它们的复杂性,也考虑了之前针对它们进行人工智能研究的丰富历史。

为此,本周发表的论文描述了DeepMind如何利用深度神经网络实现优于Stockfish、Elmo和IBM深蓝的游戏算法。

“传统引擎非常强大并且几乎没有明显的错误,但当面对没有具体和可计算解决方案的位置时,可能会发生漂移。”国际象棋大师马修·萨德勒(Matthew Sadler)说,“正是在这样的位置,AlphaZero才能实现‘感觉’,‘洞察力’或‘直觉’。“

为了测试经过全面训练的AlphaZero,除了其前身AlphaGo Zero之外,DeepMind的研究人员还对上述的Stockfish和Elmo游戏引擎进行了测试。在具有44个处理器内核和4个谷歌第一代TPU的单台机器上运行时,AlphaZero都能轻松赢得大多数比赛。

关键词:

热点
39热文一周热点