柯洁对战AlphaGo,首战告负!6个问题,带你弄清这只“狗”
2017-05-24 编辑:
作者:S.西尔维希耶
编辑:姜Zn
今天,千年水乡乌镇将迎来一场举世瞩目的围棋峰会。在为期一周的峰会中,“世界第一围棋AI”AlphaGo将与中国围棋职业九段棋手柯洁对弈三场。并与其他知名中国棋手一起进行团队赛和配对赛。
第一日对战结果
就在刚刚,柯洁与AlphaGo结束了三番棋的第一局,AlphaGo执白 1/4子胜。这也是中国围棋中最微小的胜负。
迄今为止的公开赛事中,AlphaGo VS. 人类围棋选手,战绩已达70胜1负。本文首发微博@天了噜小组长 ,抱着Logo的那只蠢猫据说是小组长本人。
在赛后新闻发布会上,柯洁表示:“(阿尔法狗)实在下得太出色了,我输的也没什么脾气,真的是很厉害。”
AlphaGo是谁?为什么这场对决会如此受人关注?这篇文章会为你梳理事情的全貌。
① AlphaGo是什么?
AlphaGo是由英国Google DeepMind公司开发的围棋人工智能程序。它可能是有史以来最强大的围棋棋手。
图片来源:deepmind.com
DeepMind公司于2010年由杰米斯·哈萨比斯(Demis Hassabis)博士、沙恩·莱吉(Shane Legg)博士和穆斯塔法·苏雷曼(Mustafa Suleyman)共同创立。其中,哈萨比斯和莱吉相识于伦敦大学学院盖茨比计算神经科学组。
与其说是一间创业公司,DeepMind看起来更像是一家致力于新技术的实验室。他们的项目包括创造一个能够以和人类一样的方式“学习”如何玩游戏并达到高水平的人工智能。在只用原始像素和游戏得分作为输入数据的情况下,他们的程序学会了包括《乓》(Pong)和《打砖块》(Breakout)在内的多种游戏的玩法,并达到了超人的水平。
2014年,DeepMind被谷歌以4亿美元收购。同年,AlphaGo项目诞生,开始一步步向围棋游戏的巅峰发起挑战。
“在‘深蓝’战胜卡斯帕罗夫之后,围棋就成了游戏AI最后的圣杯。”哈萨比斯说。图片来源:blog.google
② AlphaGo和人下围棋战绩如何?
在今日对战之前,所有公开赛事中,AlphaGo与人类围棋选手较量的战绩是——69胜1负。
2015年10月,AlphaGo在没有任何让子的情况下,以5:0的悬殊比分击溃欧洲围棋冠军樊麾二段。
2016年3月,韩国职业棋手李世石九段迎战AlphaGo,以1:4不幸败北。此战之初,柯洁曾断言李会以5:0的比分大胜,AlphaGo毫无胜算。但在李世石输掉第三盘后,柯洁也不得不承认计算机的实力强大。表示“跟AlphaGo下的话,同样的条件下,我输的可能性非常大”。
第一场对战的最后时分。之后,李世乭投子认输。
2016年12月,神秘棋手“Master”登录中国弈城围棋网,以每天十盘的速度接连击败中外各大顶尖棋手,取得了空前绝后的60连胜。人们耳熟能详的职业棋手如古力、常昊等纷纷被斩落马下,柯洁也不幸成为它的手下败将。在输给Master后,柯洁身体抱恙住院。2017年1月4日,AlphaGo团队公布“Master”背后正是升级版AlphaGo的这一事实。
曾经,柯洁用“震撼”来形容AlphaGo带给围棋界的感受,但同时也表示人类还会变得更强。如今,在乌镇的围棋峰会上,柯洁将在5天内与AlphaGo交锋三局。现在,第一局已经结束,AlphaGo以1/4子的优势险胜柯洁。之后两局,胜负将会如何呢?
③ AlphaGo对决柯洁,大家怎么看?
考虑到人工智能在网络快棋中的先天优势,目前人们仍未能断言AlphaGo在允许人类思考更长时间的慢棋中表现同样良好。不过,谈及乌镇围棋峰会上柯洁对阵AlphaGo的可能结果,人类棋手表现得非常悲观。
中国“棋圣”聂卫平表示,他认为柯洁会被0:3击溃。古力九段认为,如果柯洁发挥出100%的状态,那么他也许有5%的胜率。而曾经狂傲地认为“阿尔法狗战胜不了我”的柯洁,也谦虚地表示:“这次能代表人类出战是我的荣幸,我将尽全力去争胜,一决胜负,抱有必胜的信念和必死的决心,不轻易言败。”
古力(左一)、樊麾(左三)、聂卫平(右二)、柯洁(右一)与谷歌CEO桑德尔·皮蔡(左二)一起探讨AlphaGo的棋艺。图片来源:deepmind.com
哈萨比斯则在博客中期待柯洁能将AlphaGo的表现逼到极限,乃至超越极限。同时,由陈耀烨九段、周睿羊九段、芈昱廷九段、时越九段和唐韦星九段组成的团队也会与AlphaGo进行一场较量。哈萨比斯希望他们能够测试AlphaGo的创造力和适应能力到底在什么水平。
④ AlphaGo到底是怎么下棋的?
在一局围棋中,平均每一步的下法大约有200种可能。棋盘上可能出现的局面总数到了远大于宇宙中原子总数的地步。因此,通过暴力穷举手段预测所有的可能情况并从中筛选中最优势走法的思路,并不适用于围棋AI。
围棋棋盘上出现的可能局面数远大于宇宙中的原子数量。图片来源:Deepmind
AlphaGo选择了别的下棋方式。支撑AlphaGo提高棋力、打败人类选手的“秘诀” 有三个:深度神经网络、监督/强化学习、蒙特卡罗树搜索。
提示
此处涉及部分专业术语
深度神经网络是包含超过一个认知层的计算机神经网络。对于人工智能而言,世界是被用数字的方式呈现的。人们将人工智能设计出不同的“层”,来解决不同层级的认知任务。这种具备许多“层”的神经网络,被称为深度神经网络。AlphaGo包含两种深度神经网络:价值网络和策略网络。价值网络使得AlphaGo能够明晰局势的判断,左右全局“战略”,抛弃不合适的路线;策略网络使得AlphaGo能够优化每一步落子,左右局部“战术”,减少失误。两者结合在一起,使得AlphaGo不需要过于庞大的计算也能够走出精妙的棋局,就像人类一样。