OpenAI将创造自己的「语言」
2017-05-05 编辑:
最近,OpenAI透露,他们将在语言领域继续发力。该文的作者是Michael Kropivka,人工智能与机器学习资深研究员,AlgoBrainsLab的创始人和软件工程师。
这篇文章是关于发明一种与感知有关的语言的系统,它揭示了通过与人工语言相关的研究可能开启的可能性,至少这种语言将类似于动物典型的信号语言,更深层次的语言将演变成更复杂的技术。
世界上没有一种东西是像语言这样如此高度进化的。语言的使用能力也有所演变。这种能力出现在大约75000年前。这很简单。而我们今天所说的语言是我们的语言如何转变成口语行为。正如乔姆斯基所说,它是关于基本思维过程的次要语言。世界各地有大约6000种不同的语言。我们真正想要的是了解一个基本原则,使我们有能力获得这6000种语言的任何一种。并创建几个新的。
语言不光指必要的说话声音,还指更多的内在过程。它更接近一个思维过程。
语言在某种意义上类似视觉
从不同角度来看待物体的能力,与提问相关的细节或隐藏事实的能力其实是一样的。内部对话与想象的场景也同理。最有趣的部分是,两种能力在最低水平时,比平时都要接近。发现能够同时处理视觉和语言的系统是智力的基础。
最终目标是,通过视觉感知来形成一个识别现实的系统,然后创建抽象过程。此外,系统能够使用语言来进行抽象操作,目标是以人类思维方式连接抽象过程。
尽管语言和视觉是指头脑中相同的抽象概念,但所有抽象的来源都是现实,这就是为什么我们用最简单的视觉对象而不是语言来掌握抽象过程。之后,语言描述的对象变得与我们看到的一样真实。但是,如果没有机器与物理世界的交互,就无法掌握人类语言。这就是为什么OpenAI承诺要学会交流策略的原因所在。
进行这种研究的另一个原因是,目前将机器人置于物理世界中来学习整个环境的可能性是很小的,这需要花太多的时间。因此,通过静态数据获取语言是不可能的。唯一的办法就是要积极参与到环境中。此外,利用人类思维去进行回避实验是很难的,所以计算机模拟成为21世纪语言学研究工具的最佳候选。
我们的目标是创建一个了解我们的智能agent,这是非常困难的问题,自1960年以来,我们一直在研究。但是,我们还没有能够正式地去描述一种语言,因为没有语境,语言就是不存在的,环境就是这样的语境。
竞争与合作
我们已经看到,一个能够在强化学习实验中表现出令人敬畏的结果的系统,它就是利用DeepMind Q leaning来玩Atari游戏。简而言之,系统有相对应的环境和agent(机器玩家)来获得分数,并且agent(机器玩家)成功地学会了如何玩得更好。
图:arxiv
AlphaGo是另一个突破,关键的区别在于游戏背后有一个对手。此外,游戏环境还有多种场景。值得一提的优秀解决方案是agent(机器玩家)与自己的副本在玩。
下一步将是agent(机器玩家)能够找到一种彼此合作的方式,来实现额外的价值。OpenAI研究显示,智能agent在一个完全不同的环境中表现的很好——像人类这样的相互合作的世界。
黑箱问题
内部语言会是下一个突破,以帮助管理机器学习(ML)框架的复杂性。今天我们必须付出很多努力来解释什么是ML系统,ML系统正在做什么以及为什么要这么做。 最接近人类的语言是即将到来的与ML引擎一起工作的接口。对于多用途agent,这种语言是定义目标函数的最佳方式。
实际上,随着人工智能系统的复杂性越来越高,很难设想如何在没有语言的情况下与他们进行协作,而不用提出问题,也不用问他们“为什么”。而且,毫不费力地与电脑进行交流的能力将使他们无限有用。—— Will Knight
语言本身
除了基本结构和词汇差异,我们可以通过相同的术语来描述英语和中文:名词、动词、助词、时态等。这两种语言都是由数以千计的沟通思想在包围的现实之上创造出来的。
图:8020Japanese 日语句子结构背后的逻辑非常简单。