社会焦点

走,跟AlphaGo下棋去!(2)

字号+ 作者: 来源: 2017-05-24

据AlphaGo官方介绍,AlphaGo采用的是一种更加“通用”的人工智能方法,即将改进的蒙特卡洛决策树算法与深度神经网络算法相结合的方法构建最终的学习系统。其中,深度神经网络由一个多达12层的包含上百万个神经元节

  据AlphaGo官方介绍,AlphaGo采用的是一种更加“通用”的人工智能方法,即将改进的蒙特卡洛决策树算法与深度神经网络算法相结合的方法构建最终的学习系统。其中,深度神经网络由一个多达12层的包含上百万个神经元节点的神经网络构成,其包括两个部分:策略网络与价值网络。具体的技术细节在此不赘言,仅说说其发挥的作用。策略网络在当前给定的棋局中,负责预测下一步的走棋,并对下一步走棋的好坏进行打分,如果是好棋,就打高分,最终,最高分的走法被策略网络选为下一步棋的走法。而这个最高分要如何评定呢?此时,现存于人类数据库中的围棋棋谱的作用就体现出来了。对比以往高手对决的棋谱,如果如此走法能得到最终的胜利,那就是好棋,这步就可以评高分,因为以往棋谱的胜负是已知的,反之亦然。在这里,人类历史上的大量围棋起了训练数据的作用,好比老师在“监督”学生做练习,答对了就给高分,答错了不给分。通过对于三千万步人类棋谱的学习,AlphaGo对于人类棋手下一步走棋的预测准确率高达57%(之前为43%)。策略网络的作用好比“模仿”人类棋手的各种走法,以达到预测的效果。

  然而仅凭模仿无法击败最顶级的人类高手。因此,AlphaGo增加了价值网络来判断当前的局面,到底对哪一方有利。这一步类似于国际象棋程序中的估值函数,而具体的实现方法却有所不同。象棋程序中需要人工调整估值函数中的权重,以达到最好的效果,甚至需要水平极高的国际特级大师参与调整参数。而围棋程序的局势评估相当困难,只能通过深度学习网络之间自我训练的方法来达到良好的效果。与国际象棋程序相比,围棋好比人类用自己的知识训练电脑,使其达到人类高手的水平。而国际象棋程序则是人类亲自将行棋的方法与逻辑设计为电脑程序,最终由计算机代表人类与人类高手进行对弈。

  AlphaGo下围棋的原理和人类有相似之处,一是判断局部,二是把握全局。但是,AlphaGo就不会输吗?并不竟然。从原理上来说,在大数据时代,更加复杂且更加强大的深度学习模型能深刻揭示海量数据里所承载的复杂而丰富的信息,并对未来或未知事件做更精准的预测。但是,深度学习也有瓶颈——延迟反馈的问题。所以AlphaGo下围棋也不是深度学习包下所有的,它还有强化学习的一部分,反馈是直到最后那一步才知道你的输赢。还有很多其他的学习任务都不一定是深度学习才能来完成的。

  AlphaGo下围棋背后的DeepMind 方法其实就是深度学习和强化学习混合体,被称为“深度强化学习(deep reinforcement learning)”。简单来说,在这之中,深度学习是主体,强化学习解决了延时反馈的问题。

走,跟AlphaGo下棋去!

  AlphaGo之父、柯洁以及Alphabet董事长施密特

  AlphaGo的行业复制

  目前,AlphaGo取得的研究成果正在快速复制到各行各业,谷歌旗下的DeepMind做的第一件事情是用机器学习来管理数据中心。为了解决服务器集群的冷却管理问题,DeepMind训练了三个神经网络,并在某一个数据中心进行了应用,比人管理的时候节电40%。DeepMind认为,这个神经网络不只可以用于数据中心,具有一定的通用性,准备把它发展到发电厂、半导体制造等行业。

  DeepMind也将神经网络带到了医疗领域。有数据显示每11个成年人里就有1个会得糖尿病,糖尿病让患者失明的概率提高了25倍,如果失明的症状能在早期发现,那么有98%的可能性治愈。DeepMind与一家叫Moorfields的机构合作,拿到了近百万的原始数据。用这些数据来训练神经网络,然后从图片中提取特征,神经网络在图像识别上的错误率比人低,未来准确率会越来越高。

  资深的程序员和性能强大的电脑对AI业务至关重要,但获取真实环境数据也至关重要。利用AI和机器学习技术改进医院、电网和工厂等场合的不同系统时,需要具体的操作数据。

  当然,它所属的Google公司拥有海量可服务于这些目的的数据,以供DeepMind“挖宝”。但有关每个细分领域,DeepMind现有的数据还远远满足不了需求。最近它参与了一个研究读唇语的项目,并取得了成功,而成功的关键就在于研究团队掌握了一个庞大的数据集。该项目的研究团队主要来自牛津大学,并以计算机视觉研究者安德鲁?西塞曼(Andrew Zisserman)为首。BBC向研究团队提供了数十万小时的新闻剪辑资料。如果没有这些资料,他们根本无法让AI系统接受读唇语的训练。

  数据获取对DeepMind未来的重要性,Hassabis持轻描淡写的态度。他称,让人类工程师打造出模拟待解决问题的模型就足够了,再在这些模型中部署AI学习工具。但这并不是目前大多数机器学习系统的运作方式。如果DeepMind需要收集大量个人信息,它将需要考虑清楚:如何应对消费者对企业访问个人数据这类行为的担忧?

  近期就有类似问题曝光,DeepMind 被指控通过非法交易获取160万份 NHS(英国国民医疗服务体系)患者病历。英国国家数据监护机构(National Data Guardian) Fiona Caldicott 女爵于2月20日在致皇家自由医院信托会医疗负责人 Stephen Powis 的信件中披露了这一信息。这封信被泄露给 Sky News 并于5月初被公之于众。

  如果DeepMind能够解决这类问题,它将是人工智能推向行业的无价之宝:一个算法工厂。它将远不仅仅是Google的AI研究机构和人才集聚地。DeepMind处理过的数据仍属于原本的拥有者,但从数据中学习的软件将属于Google。无疑,在未来,DeepMind将把AI程序用来解决复杂问题,但它或许无法靠这种方式来创造大量营收。然而,AI软件通过分析数据获取的知识或技能将极具价值,让Google为曾经的天价竞标付出的一切努力物有所值。

  人工智能超越人类了吗?

  李世石在围棋人机大战第一盘中的失利,几乎掀起了轩然大波,似乎一夜之间人工智能已经战胜人类智能,今天“人机大战的第二场”让大家继续意识到人工智能完全超越人类智能的那一天似乎也不会遥远了。为此,需要对“人工智能”的概念做一个简单的澄清。

转载请注明出处。


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章