当前位置:首页 > 深度文章 > 正文

对战AlphaGo,为什么柯洁一局都赢不了?

2017-05-26 16:51:16  [来源:新华网]

5 月 23 至 27 日,曾战胜围棋世界冠军李世石的谷歌人工智能 AlphaGo,在浙江乌镇挑战目前世界排名第一的人类棋手柯洁九段。

23日下午,柯洁首战告负,输四分之一子。

在人类棋手之间,这种结果说明双方棋艺基本旗鼓相当。所以有人据此认为,柯洁只是惜败。

事实上,柯洁远非惜败,而是 AlphaGo 完全掌控了棋局,在确保胜利的同时,不冒无谓的风险。

在这场人机大战开赛前,前谷歌大中华区总裁李开复就公开表示:柯洁必败毫无悬念。

不仅科技界人士这么认为,概率也显示柯洁几无胜算。根据国际职业围棋 Elo 等级分制度排名,可算出 AlphaGo 每盘的获胜概率为 99.37% 。说这是一场起重机与举重选手的比赛并不为过。

▍2016 年 7 月 18 日,AlphaGo 超越柯洁成为 Elo 排名第一(左侧排名),之后不久就被柯洁反超(右侧排名)。2017 年 2 月初,Go Ratings 网站删除了 AlphaGo、DeepZenGo 等围棋人工智能在该网站上的所有信息,目前世界排名第一的柯洁 Elo 3620。

▍AlphaGo 开发团队主管 David Silver 使用 Elo 算法评估 AlphaGo 的 Elo 为 4500。对阵柯洁,AlphaGo 的胜率 P(A) = 1/(1+10^((3620-4500)/400)) / 图片来自:Advanced Study Room

从击败樊麾二段(Elo 3000 左右),到击败李世石九段(Elo 3500 左右),AlphaGo 只用了五个月。相比之下,从 Elo 3300 到 3600,天才棋手柯洁走了将近五年。

▍柯洁的 Elo 上升路径

2016 年底,AlphaGo 化名“Master”横扫围棋网战平台时,即已强大到让柯洁感叹“人类几千年来总结的棋谱都是错的”。

AlphaGo 为什么这么厉害?它到底是怎么下棋的?人类顶尖围棋高手在人工智能面前的集体溃败,意味着什么?

寡不敌众的世界冠军

早在 20 世纪 50 年代,计算机科学家就开始研究让人工智能与人类下棋了。棋盘游戏是人类智力的博弈,如果能达到顶尖棋手的水平、甚至超过他们,便可证明人工智能变得更聪明、更有灵活性。

人类下棋,是经验、理性与灵感的结合。

昭和棋圣吴清源就将决定围棋胜负的三个要素归纳为:实力、气力和运气。

以此标准,人工智能“先天不足”,只有理性,靠什么与人对弈?

一言以蔽之:搜索

早在 1952 年,人工智能就通过穷举所有可能性的”暴力搜索“,在井字棋这样的小型棋类游戏中战无不胜。

▍在谷歌搜索框中输入“tic-tac-toe”,就能跟电脑下井字棋

下面这幅树状图,展示了井字棋游戏中可能出现的部分棋盘情况。

人工智能要做的,就是沿着这棵“游戏树”一步步往下搜索,在所有可能出现的棋盘局面中,根据最有利于己方的终局结果,向前回溯至当前节点,决定下一步应该怎么走。

但对棋盘更大、可能性更多的游戏,暴力搜索就行不通了,因为棋局的可能性远超人工智能的运算能力,纯靠搜索不可能下赢顶尖棋手。国际象棋和围棋一度被认为是“人类智慧的最后堡垒”,原因就在于此。 要在这类游戏中战胜人类,人工智能必须在暴力搜索的基础上优化改进。

取得突破的是 1997 年 IBM 开发的人工智能深蓝,它战胜了国际象棋世界冠军卡斯帕罗夫。这是历史上人工智能首次在正式比赛中,下赢国际象棋顶尖棋手。

相较用于井字棋的暴力搜索,深蓝的改进主要在两个方面:

一、优先搜索胜率最大的棋局,以便能预测更多步以后的棋盘情况;二、即便如此,也无法像井字棋那样搜索到最终局,这时就要评估当前棋局做出评估,判断下一步怎么走,未来胜率更大。

不论是搜索还是评估,深蓝的算法都包含了大量的人类智慧。深蓝仅评估算法就有 8000 多个部分,很多是为特定棋局专门设计的。为完善算法,提高胜率,IBM 还专门请来包括国际象棋特级大师乔尔·本杰明在内的多位顶尖棋手做参谋。

因此,与其说深蓝战胜了人类,不如说超级计算机+科学家+一群顶尖棋手,战胜了一个卡斯帕罗夫。

但是,深蓝这种人工调试算法的策略,在围棋上却难以取得相同战绩。

这是因为,围棋的可能性和变数都远超国际象棋,即使最顶尖的围棋选手,也很难用有逻辑的语言清晰阐释自己的下棋策略,更不用说把这种策略转化为计算机能够理解执行的编程语言。

人工智能的胜利

围棋的棋盘为 1919 的网格,比国际象棋大,可能的下法(10^174)超过已知宇宙中所有原子数目的总和(10^80)。巨大的变数和可能性,让围棋棋道几乎成为一门玄学。

AlphaGo 下围棋的策略,与按人类预设剧本下棋的深蓝不同,其下棋算法没有经过人工调试,全部是靠自己“学会”的。

▍AlphaGo 的“游戏树” / 图片来源:Nature

[责编:潘晓慧]
最热图集
最热文章
关注我们
@华声大视界
华声大视界微信公众号:dsj_voc
【扫一扫二维码】
大视界,用平民视角展现世界的另一面