社会焦点

机器之心专访腾讯「绝艺」团队负责人:用全新强化学习方法造就更强模型

字号+ 作者: 来源: 2017-03-24

机器之心专访腾讯「绝艺」团队负责人:用全新强化学习方法造就更强模型,职业围棋棋手每年多少薪水,围棋棋手工资,为什么绝艺十段了,围棋业余5段棋手名单

3 月 19 日,在全部由人工智能参加的 UEC 杯世界围棋大赛中,绝艺战胜了所有对手。据介绍,在本次比赛结束后,腾讯 AI Lab 将公开「绝艺」技术细节,助推围棋 AI 发展。机器之心第一时间专访了腾讯 AI Lab 高级总监、「绝艺」团队负责人刘永升,他向我们揭示了「绝艺」背后的秘密。

3 月 19 日下午,第 10 届 UEC 杯计算机围棋大赛在东京落幕,腾讯 AI Lab(腾讯人工智能实验室)研发的围棋人工智能程序「绝艺」(Fine Art)首次参加比赛便一路过关斩将,继 18 日的积分赛七连胜进入 16 强后,在 19 日的淘汰赛中又以四连胜的战绩夺得了本届 UEC 杯冠军。在决赛中,绝艺执白面对来自日本的人工智能「DeepZenGo」,用时 29 分钟,196 手中盘战胜对手。据腾讯介绍,今年 3 月 26 日,「绝艺」还将在东京与日本先锋棋手一力辽在「电圣战」中进行人机对弈。

「绝艺」在第十届 UEC 杯决赛中对阵 DeepZenGo 的棋谱

UEC 杯计算机围棋锦标赛 2007 年始于日本,由日本电气通信大学举办,是最具传统和权威的计算机围棋大赛,每年邀请各国高水平 AI 齐聚东京比赛,促进相关学术及科技的交流。日本的 DeepZenGo(3 次)、法国的 Crazy Stone(4 次)等世界著名人工智能围棋程序曾先后在 UEC 杯折桂。此外,Facebook 的 Dark Forest 曾于 2016 年的第九届闯入了决赛。今年的比赛吸引了 30 支队伍参赛,由于腾讯绝艺的参赛而格外引人注目。本次大赛还请到曾获日本围棋四大家之首「本因坊」头衔的王铭琬九段进行现场解说,也体现了日本棋院方面对于此次赛事的重视。

据称,本次 UEC 也邀请了 DeepMind 的 AlphaGo,但后者选择不参赛。不过这并不意味着谷歌旗下的团队停止了 AlphaGo 的开发,它将于 4 月与中国顶尖棋手柯杰进行人机对战。

机器之心专访腾讯「绝艺」团队负责人:用全新强化学习方法造就更强模型

决赛阶段十六个人工智能的胜负记录

「很高兴『绝艺』能够在 UEC 杯夺冠,这是非常难得的宝贵经验。『绝艺』不同于其他实验室 AI,它得益于世界超一流棋手的指导,通过不断与高手交流及学习,一步步成长起来。我们希望,通过『绝艺』能够让更多人关注、喜爱进而传承围棋这一传统文化。」腾讯公司副总裁、腾讯 AI Lab 负责人姚星在赛后表示,「『绝艺』在研究价值上也不止于围棋 AI 本身,我们在深度学习和强化学习上进行了非常有价值的探索与创新,之后将通过论文公开这些技术创新和数据库的细节,为推动围棋 AI 的技术进步出一份力。腾讯 AI Lab 的发展愿景是,让 AI 未来无处不在,因此我们将以开放合作的态度,与业界一起共同推进全球 AI 技术的发展。」

「绝艺」曾先后使用多个 ID,在腾讯围棋(野狐围棋)平台与业余和职业高手切磋,多次战胜中日韩三国一众顶尖棋手,成为腾讯围棋首个晋级「十段」的棋手。截至 3 月 9 日,「绝艺」对局数量达 534 盘,战绩是 406 胜 128 负,胜率 76%,与柯洁、古力、常昊、范蕴若、范廷钰、朴廷桓等超过 100 位知名人类棋手有过交锋。

与此前多次击败人类世界冠军的 AlphaGo 类似,「绝艺」的训练主要包括人类棋谱数据库和机器自对弈,它的算法基于策略网络与价值网络两大核心,并创新性地大幅提升了价值网络的精度,使其大局观表现更好。通俗的说,「策略」指每一步博弈时,各种选择的取舍,选好棋弃差棋,这是偏微观评估;而「价值」则指能看懂棋局,判断目前棋局的胜率,这是偏宏观的评估。

一年前,绝艺还只是一个存在于团队头脑中的想法。2016 年 1 月 28 日,腾讯 AI Lab 高级总监、专家工程师刘永升在内部 IM 上收到一条来自腾讯副总裁姚星的消息:有没有信心做围棋 AI,如果围棋不行,先做象棋 AI 也行。彼时刘永升对围棋人工智能还没有太清晰的概念,于是答复姚星好好调研。在当年春节假期,刘永升找了一些围棋的书籍、论文阅读,对围棋 AI 有了基本了解。春节回来后,2 月 17 日,姚星问围棋 AI 有没有在做,刘回答:还在调研,并承诺一个月后出 DEMO。

2016 年 3 月 4 日,第一个 DEMO 完成,棋力在业余 5 级左右,到 3 月下旬,围棋 AI 正式立项,项目名称 weigo,团队也随之搭建起来。到 2016 年 6 月下旬,绝艺棋力突破业务 6 段,意即突破业余高手水平,这是绝艺的一个重要发展节点。

2016 年 8 月,绝艺以「虎虎有生气」的 ID 首次在野狐围棋(腾讯旗下围棋对弈平台)下棋,8 月 23 日首次战胜职业棋手,9 月 4 日,绝艺以「野狐扫地僧」ID 连赢 ID 为 tby 的网友 8 局,tby 是聂卫平长子孔令文的账号。在不断的学习中,绝艺的能力不断增强。

2016 年 11 月 1 日,绝艺正式以「绝艺」ID 亮相野狐,11 月 2 日第一次战胜世界冠军江维杰(ID 若水云寒)。11 月 19 日晚,「绝艺」首次和柯洁交手,一胜一负;11 月 28 日,「绝艺」对韩国第一人朴廷桓 5 胜 1 负。2017 年 2 月 14 日以后,绝艺对野狐帽子棋手(世界冠军和全国冠军)的胜率,已经能够稳定在 90% 以上。

机器之心专访腾讯「绝艺」团队负责人:用全新强化学习方法造就更强模型

  自 2016 年 8 月起,绝艺一直在腾讯野狐围棋上与人类棋手进行比赛,随着系统的不断改进,它的成绩也越来越好。在今年初,「绝艺」接连战胜几名中日韩九段职业棋手,终于在今年 3 月 3 日晋级成为「10 段选手」,这是野狐围棋平台上第一位达成「10 段」称号的「棋手」。

腾讯的人工智能为何能够这么快战胜世界冠军级棋手,获得世界比赛冠军?作为「绝艺」的开发者,腾讯 AI Lab 的研究方向都有哪些?在 UEC 杯夺冠后,机器之心采访了腾讯 AI Lab 高级总监,「绝艺」团队负责人刘永升,让我们看看「绝艺」背后的秘密。

机器之心专访腾讯「绝艺」团队负责人:用全新强化学习方法造就更强模型

有关本次比赛

机器之心:时间拨回到比赛之前,你们有讨论过可能出现的赛事结果吗?或者说当时有夺冠的信心么?

转载请注明出处。


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章