财新传媒
位置:博客 > 知识分子 > 人机大战成“绝唱”:人类围棋向何处去?

人机大战成“绝唱”:人类围棋向何处去?

 
前言:
 
5月23号到27号,中国围棋知名选手江铸久九段和芮迺伟九段伉俪在浙江乌镇亲历了AlphaGo对阵柯洁的人机大战。他们叹服于“AlphaGo Master”的功力之深,水平之高,也因此坚定了继续在中国开展围棋教育的信念。
 
 
这场比赛也成为AlphaGo的最后一场围棋比赛。据DeepMind CEO 德米斯·哈萨比斯介绍,接下来,AlphaGo团队将转而解决人类在医疗健康和科学研究等领域面临的新挑战。AlphaGo的算法已经在帮助谷歌服务器节能方面取得成效,他希望未来能开发出“AI科学家”,帮助科学家们在能源、材料设计、药物研发等领域取得突破。
 
 
AlphaGo 过往左右互搏的50张棋谱也将被公开,供全世界的围棋选手研究。在江铸久看来,这是一笔宝贵的财富,必将成为今后棋手最主要的一种学习模式。以下,是江铸久记录的观赛感想。
 
撰文 | 江铸久(围棋职业九段)
责编 | 徐    可
 
● ● ●
 
|5月23号| 
 
AIphaGo和柯洁的人机大战开战,这是一场让人期待已久的对决,因为AlphaGo Master在今年年初的时候用快棋在网上横扫中日韩高手。60盘棋不败,这是非常令人震撼的胜率。但是毕竟是快棋,是人类要在30秒之内作出决定的快棋。我们还是希望能够看到人类棋手在更充裕的时间内,与AlphaGo对阵,比如每方三小时会下成什么样。AlphaGo的厉害,人们已经知道了。我更想知道,人类与AlphaGo究竟差距几何?
 
第一场比赛,柯洁执黑下出了三三,跟着在白棋第六手小目高拆二守角的情况之下,又下了点三三,这是采用了AlphaGo在新年期间的手法。也许这就是柯洁准备的作战计划——故意模仿AlphaGo的风格。可是AlphaGo在针对厚味的棋形处理上是驾轻就熟的。最重要的一点是这不是柯洁本身最擅长的地方。给我的感觉是柯洁太在意如何遏制AlphaGo了。可以说从这个点三三起,AIphaGo就开始利用全局的厚味一点点去挤压黑棋。
 
白棋从48拆开始让人感到有点意外,因为从小目拆一符合棋理,离对方的厚势稍远一点。它拆二,然后黑棋当然是打入下边白阵地了。嘿,白棋在黑厚势上点一下,这个也算是正常。紧跟着白棋尖顶俗手把自己的角上方地紧紧拦住,这样让我们担心起跟厚势一起如何补的时候白棋下出了54断,勇于落后手的下法。第一感觉是吃了一惊,因为这就是中盘时甘心落了一个明显的后手。
 
普通的人类棋手是不会这么于闲着处落后手的。细细品,这步后手的妙味慢慢地泛出浓郁的芳香。因为有了这手棋,白棋彻底消掉了黑棋的左边厚味,左下角得到加强,全局的主动性都变得简明起来。
 
当天我就发了一条朋友圈:
 
“AlphaGo在今天最亮的一个亮点,是抓住了人类没有想到的一个盲点。这也显出了人类思维的局限性。
 
从新年以来,俺开始打谱学习AIphaGo master留下的60局棋谱,并且做了学习笔记,汇成了内部资料供孩子们学习。AlphaGo行棋速度快,效率高,掌控局面的能力超强。今天再次给我们上了一课。”
 
|5月24号| 
 
今天是论坛,DeepMind团队给大家讲解AlphaGo是如何深度学习的。其中爆炸性的新闻是说AlphaGo经过这一段的深度学习,已经比同李世石下棋时的版本进步了三个子。这三个子在棋盘上就是不得了的距离。由于本来现在的职业与业余之间的距离都非常小,我们不太相信AIphaGo能够真的让三个子。
 
因此午饭的时候我们特地找到哈萨比斯先生去求证。哈萨比斯给我们的解释是说系统自己测定的是这样的差距。首先,已经修正了跟李世石下棋时的bug。不会再出类似错误。这是在“AlphaGo李”同“AlphaGo柯”的内部测定对局。科技时代的速度使得他们内部评估的距离是三个子。当然他说并不代表能让人类棋手三个子,也许是两个子。即便如此,这也是非常震撼的消息。听到上午发表的论文消息,柯洁立刻发表了微博,表示了震惊。那么我们再联想到AIphaGo跟柯洁下这盘棋,取得些许优势之后,几近于滴水不漏的感觉,那确实是AlphaGo非常强大的表现。想起3月份到日本的时候,碰到了武宫正树老师、赵治勋老师和小林光一老师,他们都不约而同地认为如果是60连胜,按照棋份来说,那是两个子的棋份了。
 
不管怎么说有一点各国棋手是相通的,那就是大家都在打AlphaGo的棋谱。AlphaGo吸取了以前强手的精华,并且几乎在每一盘棋里都有新的创造,这些弥足珍贵。可以预计这将成为棋手下一步最主要的一种学习模式,那就是认真学习AlphaGo所下的棋。如果有一天AlphaGo出单机版,我相信很多棋手都会尽可能跟他对练,从中学习到很多有意义的招法。
 
但是人类的学习深度也有了几千年的积累,现在围棋的核心部分是人类棋手创造的。AI也是抓住了这样一些历史上精彩的瞬间让人能感受到AlphaGo人文的一面,有情感的一面。
 
从学习的角度我们希望多看到一些人机对决。现阶段AlphaGo的棋还基本上没有看不懂的。虽说他的有些招法你暂时不理解,但是仔细琢磨之后还是能够明白的,当然你未必下得出来。
 
像第一盘AlphaGo最妙的当然是白54,可是对于人类棋手来说,更想了解的是,他是从48手的时候就有这样的计划吗?还是说从更早一点吃掉对方角上两个子时就已经开始准备呢?消除黑棋厚势是早做了这样的准备呢,还是随时可以看到很远的招法及时调整呢?真是让人觉得意味深长的事。
 
这些是人类的深度学习。这实际上因为到目前为止AlphaGo确实是超越了人类最强的棋手。但是它究竟有多强?我的感觉是AlphaGo遇强则强。大家在看棋的时候自然期待人类的最强棋手能够战胜AI,不过,如果能够把它的最强逼出来,就已经是成功了!
 
|5月25号| 
 
第二局,感觉柯洁放开了,拼命了,下得非常出色,可以说是逼AlphaGo使出了浑身解数。据赛后公布的数据,AlphaGo认为前100手是双方最善。虽然后半盘柯洁弈出问题手,棋局戛然而止。但是那一局棋,令许许多多的观众热血沸腾。
 
很多记者在第一局第二局后都在不停追问DeepMind准备何时公布后台的数据。我们可以设想,现在的AlphaGo还远远没有达到完美的境界,但是他站在人类的肩上已经使我们看到了一个非常远的未来,那就是还有很长的路要走,围棋可以有更加广阔的空间。
 
AlphaGo的出现,是我们人类棋手的幸运。至于说今后整个社会是不是会有一少部分人去控制发明创造人工智能,而另一部分人的工作可能都会为人工智能所取代,这可能是一个更加宏大的人文课题。
 
|5月27号| 
 
第三局,柯洁前半盘弈出问题手,之后奋力拼搏,一度使形势非常接近,但后半盘还是被拉开了距离。到了这时候,我感觉胜负不是最重要的(当然对柯洁可能是)最重要的是他们两个下出什么样的棋,给我们看到什么样的精彩内容,这一点,我想大家没有失望。
 
赛后的新闻发布会上,主办方DeepMind之父哈萨比斯先生宣布AlphaGo将退出围棋赛事! 也就是说,AIphaGo将退出江湖,从现在起只给我们留下背影。DeepMind团队同时宣布,将陆续公布AlphaGo互搏的50局棋谱。今天先公布10局,我看了几个片段,那真的是有着许多可以颠覆围棋观的内涵啊,谷歌的武功秘籍公开了。
 
经过这几天下来与AI的接触,让我们感受到,中国的儿童围棋教育显得更加迫切,这些棋谱是宝贵的财富,是围棋真谛的延续。2011年,我们开办了针对孩子的江芮围棋学校,平时也通过“江芮围棋”微信公众号发布和学棋有关的文章。学习围棋可以让孩子从很早开始就接受逻辑推理训练,培养他们的集中力和如何抵御挫折,“润物细无声”。我们需要学习的太多了,老师也跟着要学习,围棋教育跟我们用什么方法关系很大。新的一代获得了比前辈更高的起点,更应该去把围棋精神发扬光大。
 
致敬谷歌,同时又非常感伤,一段传奇真的就这样离开了吗?
 
回味这场“绝唱”,在传承方面,AlphaGo吸收了很多前辈高手的精华并予以再创造。在棋局中,我看到它的很多招法有当年吴清源老师的影子,心里非常感动。也许,上天是通过AlphaGo映照出了很多职业棋手在历史上那些让人难忘的场景,那些可歌可泣的精神。我相信,无论科技进步到哪一层面,人类文明的精神、围棋的精神是永远值得我们景仰和致敬的。



推荐 7