围棋被看成是一个计算机很难攻克的游戏,因为它严重地依赖于直觉、策略思考,需要在棋盘上赢下多场战役。仅仅是记住所有的棋子位置组合、评估棋局、构造和执行赢棋的策略,对于单台计算机来说,是非常有难度的。
但是这些都没能阻止DeepMind 的AlphaGo,它战胜了这一切。AlphaGo的深度神经网络让它能自己学会下棋。程序员们设置了关于围棋的基础启发式(heuristics),给AlphaGo一个数据库,从160,000个现实生活中的围棋对弈游戏中抽取出3000万个棋局, 来进行分析,分解其核心思想,然后,计算机能数百万次地重复游戏,在这一过程中进行学习。
这个策略已经有所回报。 2015年10月,AlphaGo以5:0 的比分战胜欧洲冠军樊麾,这是历史上第一次,电脑在一个全面的19x19棋盘上击败了一名专业人士。 2016年3月,它击败了韩国的世界冠军李世石,比分是4比1,而从2016年底到2017年初,AlphaGo(伪装成“Magister”和“Master”)秘密地打了51场在线比赛,对手都是世界上的顶级玩家。
现在,最后的对决即将到来:5月23日,AlphaGo和世界排名第一围棋手柯洁将在中国乌镇进行颠覆对决。
在围棋上的成就使得AlphaGo成为了聚光灯的焦点,但是,DeepMind 的这一程序还有另外一些东西,也就是智力(Mind)。DeepMind的联合创始人Demis Hassabis表示:“总而言之,我们的工作说明了利用生物学启发机制结合最先进的机器学习技术来创建能够学习和掌握各种挑战性任务的代理人的能力。”
而且,如果不断地输给一个近乎完美的机器人对手,这对人类来说也并不是什么有趣的事。AlphaGo的粉丝它在围棋上的统治力是一种解放。人类可以从中进行学习。正如哈萨比斯所指出的那样,完美都希望与更强的对手竞赛,这一才能提升自己。
“阿尔法的游戏使我们感到解放,也就是说,没有什么下法是不可能的”,专业的围棋手周瑞羊说。 “现在每个人都试图以一种以前没有尝试过的风格来下棋。”
但是,AlphaGo的胜利并不完美。正如李世石曾经说过的那样,“机器人将永远不会像人类一样体会到围棋之美。”
他可能是正确。至少目前来看是,人类所感知的世界与机器所“看”到的世界是截然不同的。
不过,当我们的目标只是赢得比赛或者解决问题,上面的这些还重要吗?拿无人车来说,也许有人会喜欢驾驶的愉悦,这种心情,机器肯定体会不到。但是,这是否意味着机器就不能更高效地运送乘客、减少交通拥堵、避免事故,消除路怒,甚至在不需要救护车的情况下把病人直接送到医院?
并且,如果这件事确实如此重要的话,那么大师李世石所提到的“美”,也确实在AlphaGo中得到了体现。
樊麾就曾对AlphaGo与李世石比赛中第二盘的“第37步”念念不忘,“这不是人类会下出来的棋”,樊麾说,“我从来没看到过有人走出这样的棋,太美了。”
DeepMind 宣布的乌镇围棋人机对战时间表:
第一天,5月23日,开幕式、柯洁与DeepMind比赛第一场、媒体会;
第二天,5月24日,未来AI论坛;
第三天,5月25日,柯洁比赛第二场,媒体会;
第四天,5月26日,组合对战,团队比赛,媒体会;
第五天,5月27日,柯洁比赛第三场,闭幕式。
相关阅读:
相关推荐:
转载请注明出处。