首页 > 社会焦点 > 正文

走,跟AlphaGo下棋去!

2017-05-24 编辑:

走,跟AlphaGo下棋去!

走,跟AlphaGo下棋去!

  5月23日,传说中的“人机大战第二季”上演了,这一次,AlphaGo2.0来到了中国乌镇。AlphaGo2.0与围棋现排名世界第一的柯洁九段进行了三番赛对弈(此前都是五番赛)的第一场,结果是AlphaGo执白1/4子险胜。这一从去年夏天就“被谣言”的消息,在各方的期待中变为了现实,意义就不仅仅局限在围棋领域。当下,在金融、医疗、教育等各个领域,人工智能对于人类社会的基础性变革影响力已经展开。这种变革的过程进展飞快,它把我们又卷入了一波技术浪潮带来的、打破均衡、再造均衡的过程。

  AI进化者:AlphaGo、Master、AlphaGo2.0

  人工智能(AI)和机器人领域的从业者,都对2016年3月李世石与AlphaGo的对决印象深刻。这场“人机大战”让AI从幕后走向了台前,几乎每一位地球人都意识到了AI的发展已经走进了日常生活,未来,还将颠覆我们的生活。

  追根溯源,AlphaGo是一款由Google旗下DeepMind团队研发的围棋人工智能程序。“破解智能,用它来让世界变得更好”是打开DeepMind官网后,清晰可见的口号,DeepMind公司早在2014年就以4亿英镑的价格被谷歌收购,今时今日仍是Google截至目前在欧洲地区的最大收购案。而在Google之前,包括特斯拉创始人马斯克、Facebook创始人扎克伯格在内的许多硅谷大佬们也都曾向DeepMind抛出过橄榄枝。

  人工智能程序AlphaGo首次被大众熟知是在2015年,因其在没有让子的前提下以5:0击败中国旅欧职业棋手、欧洲冠军樊麾。

  随后,AlphaGo以4:1战胜世界围棋名将李世石,这场被称为全球顶级“人机大战”的对抗中,AlphaGo的实力首次被世人真正认可。

  但是,围棋界人士也表示,李世石心态上准备不足,在比赛中未必发挥出真实的最高水准。DeepMind创始人Demis Hassabis在赛后也表达,希望AlphaGo能与中国的高水平棋手对弈。

  AlphaGo在未能“华山论剑”的时间里,江湖还是有它的各种传说,比如“化身” Master标注为韩国九段,在围棋网站弈城与野狐上不断发起挑战,先后击败了包括世界冠军常昊、时越、芈昱廷、唐韦星、古力在内的诸多好手,以及“韩国第一人”朴廷桓与“日本第一人”井山裕太都败北。世界排名第一的柯洁也在与Master的对抗中败下阵来。直到最后,Master宣布自己就是AlphaGo,而代为执子的就是AlphaGo团队的黄士杰博士。

  在结束了Master的测试后,DeepMind团队于1月下旬宣布推出新版“AlphaGo”,也就是这次来中国的AlphaGo 2.0。这一版本的升级亮点是——摒弃人类棋谱,即仅通过监督学习和强化学习,再度进化出新的“围棋机器人”。

  柯洁遭遇了一个全新的、更强大的对手。

走,跟AlphaGo下棋去!

  执黑的柯洁落下了第一子

  AlphaGo为什么能不断赢

  一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

  在AlphaGo出现之前,基于传统算法的围棋程序仅能达到业余棋手的水平,远远不能令人满意。而AlphaGo横空出世后,首战即以5:0大胜欧洲围棋冠军樊麾二段,展现出不俗的实力。因此,说AlphaGo的出现严重动摇了人类智能在围棋上的垄断,是毫无问题的。那么,AlphaGo及其研发团队DeepMind都有什么亮点呢?

  在谈及AlphaGo及其开发团队DeepMind之前,必须先介绍一下其领导者Demis Hassabis,可以说,在他出现之前,几乎所有研究者都认为在十年内人工智能战胜围棋大师的机会是渺茫的。而在他出现以后,几乎所有人都在惊呼人工智能已破解了围棋这一历史难题,甚至在极短的时间内两次让研究成果上了《Nature》杂志的封面。因此,英国《卫报》直呼Hassabis就是人工智能领域的超级英雄。Hassabis个人完全配得上这个称谓。

  据《卫报》报道,Hassabis的终生目标就是开发出“通用”的人工智能程序,来解决生活中的一切问题。他分别取得了剑桥大学和伦敦大学学院的计算机科学和神经科学学位。Hassabis称自己领导的项目就是“21世纪的阿波罗项目”,这也难怪AlphaGo在击败了李世石九段之后,Hassabis第一时间在Twitter对团队的祝贺中用“登月”形容围棋程序击败人类顶尖棋手的意义。而在此之前,DeepMind通过对近期人工智能技术中最热门的一项技术——深度学习网络,加上“强化学习”的方法使计算机通过自学的方式在上世纪七八十年代的雅达利经典游戏中,获得了近乎人类的表现。而这一成果在更早先的时候登上了《Nature》杂志的封面。拥有千年历史的古老游戏与三十年前的像素游戏纷纷被人工智能攻破,恐怕在未来若干年间,人工智能在任何游戏中都强于人类也不会是太令人震惊的事情吧。

  以上所有人工智能领域的发展,都离不开一项技术在近年来的突破,那就是深度学习(Deep Learning),深度学习是传统的神经网络技术的再发展。何为神经网络?神经网络就是人类提出的一套模拟大脑工作方式的计算机算法。人的大脑有100亿个神经元,人类对于环境的感知,对于未知事物的认知与神经元的“可塑性”息息相关,人脑通过对特定的人物或者感兴趣的知识进行“建模”,神经元形成相互连接的“神经网络”,并通过互联神经元的连接强度,即突触权值来储存知识。而所谓人工神经网络,就是将化简后人脑的神经元模型实现于电子计算机之上,从而得到类似于人脑的功能,使计算机可以通过“学习”从外界环境中获取知识。

  输赢并不是AlphaGo的目的

  最初等的人工神经网络出现在20世纪50年代末的“感知机”模型,初步展现了人工神经网络的学习能力,后来的研究表明感知机模型只能解决很有限的几类问题。神经网络的最新发展——深度学习方法源于Geoffrey Hinton教授等人三十多年来的不懈努力研究和推广,自诞生之日起,即在机器学习领域中大放异彩,通过深度学习方法训练出来的模型,在某些特别的图像识别和语音识别的任务中,甚至有超过人类的表现。在当下,深度学习方法是最接近人类大脑的人工智能学习算法。


大家都爱看
查看更多热点新闻