本文作者 Ben Medlock 是 SwiftKey 的联合创始人。SwiftKey 是一款使用预测技术来适应用户打字习惯的移动应用。Medlock 参与评议过许多著名的国际期刊,并且在自然语言处理领域的顶级会议 ACL 上发表过学术论文。本文观点不代表机器之心的看法。
我们往往会认为心智(mind)位于更原始的认知结构(cognitive structures)之上。我们认为我们是有意识的存在,毕竟,我们在以某种方式感受我们心跳的韵律和肠胃的悸动。如果大脑中的运算可被分离出来或分层,那么也许我们构造出类似于这个顶层的东西,并绕过有机物特有的杂乱肉身而实现人工智能。
我理解这种观点的吸引力,因为我曾联合创立了一家语言预测软件公司 SwiftKey,该公司后来被微软收购了。我们的目标是模拟出人类理解和操作语言的了不起的过程。我们取得了一些不错的进展:我对我们在 2012 年到 2014 年之间为物理学家史蒂芬·霍金所开发的优雅的新交流系统而感到十分自豪。但尽管有这些鼓舞人心的成果,但绝大多数时间我都被不断提醒我们离类似人类的人工智能还遥不可及。为什么?因为分层的认知模型是错的。目前大部分人工智能研究者都缺失了整个蓝图的一个核心组分:具身化(embodiment)。
在 20 世纪 50 年代现代人工智能起步的时候,研究走上了错误的方向。计算机科学家决定通过构建基于符号的逻辑系统来尝试模拟有意识的推理。这种方法涉及到将真实世界的实体和数字代码关联起来以创造出关于环境的虚拟模型,然后该模型可被用于投射回这个世界本身。比如说,使用符号逻辑,你可以通过使用类似「猫>是>动物(cat > is > animal)」这样的数学公式来编码特定的知识,从而指示一台机器「学习」到:猫是动物。这样的公式可以汇集成更为复杂的陈述,从而让系统可以操作和测试命题——比如你的猫平均下来是不是和马一样大,或者是不是很有可能会追逐老鼠。
这种方法在简单的经过设计的环境中取得了一些早期的成功。比如 MIT 计算机科学家 Terry Winograd 在 1968 年到 1970 年之间创造的一个虚拟世界 SHRDLU,用户可以通过与这台计算机交谈来在简单的块状体(如椎体和球)周围移动。但事实证明,在面对真实世界问题时,符号逻辑完全不行。在真实世界中,经过精心调节的符号在面对模糊定义和多重解释时就会崩溃。
后来几十年,随着计算机算力的提升,研究者开始转向使用统计学来从大量数据中提取模式(pattern)。这些方法通常被称为「机器学习(machine learning)」。机器学习并不试图编码高级知识和逻辑推理,而是通过一种自底向上的方法来让算法通过重复任务来分辨关系,这些任务包括分类图像中的视觉目标或将录音转录为文本。比如,这样的系统能够通过查看数百万张猫的照片学会识别猫,或根据猫和鼠在大量文本中被描述的方式来找到猫和鼠之间的关系。
近些年来,机器学习已经产生了很多实际的应用。我们已经创造了在语音识别、图像处理和阅读唇语上超越人类水平的系统,也造出了在国际象棋、Jeopardy! 和围棋上击败了人类的系统,另外还有能够创造视觉艺术、合成流行音乐和编写自己的软件程序的系统。在某种程度上,这些能自我学习的算法模拟了我们所知的有机大脑的潜意识过程。机器学习算法从简单的「特征(feature,比如单个字母或像素)」入手,然后将它们组合成更复杂的「类别(category)」,同时还考虑到了真实世界数据中所固有的不确定性和模糊性。这在某种程度上类似于视觉皮层,其能够接收来自眼睛的电信号并将其解读成可识别的模式和目标。
但是能像人一样思考的算法仍遥不可及,两者最大的区别在于生物进化以及信息处理方式。人类由数万亿个真核细胞组成,真核细胞在 25 亿年前的化石之中首次被发现。一个人类细胞即是一个非比寻常的网络,其组件数量等同于一架现代化大型喷气式客机,这是一个长期而深入的自然进化过程的结果。在《Basin and Range(盆地与山脉)》(1981)一书中,作者 John McPhee 发现,如果你站着把手臂伸展出来以表示地球的整个历史,复杂的有机体开始只在手腕处进化,而且「你拿着一个中型的指甲锉,一下子就可以抹除人类的历史」。
传统的进化观点暗示人类细胞的复杂性来自于早期真核细胞的随机突变和选择。但是在 2005 年,芝加哥大学生物学家 James Shapiro 描述了一个激进的新观点。他认为真核细胞通过自我操控 DNA 响应环境刺激以「智能地」适应有机体寄主及其环境。最近的微生物学发现佐证了这一想法。例如,哺乳动物的免疫系统倾向于复制 DNA 序列从而可以产生有效的抗体应对疾病攻击;现在我们知道 43% 人类基因组是由 DNA 组成的,通过一种自然的「基因工程(genetic engineering)」过程,DNA 可以在不同位置之间移动。
现在,这只是聪明的自组织细胞进化为大脑型智慧生物过程中的一丁点的小跨越。但重点是很久以前我们已是有意识会思考的生物,细胞读取环境数据并协同工作以将我们塑造成稳健可持续的存在。那么,我们认为的智能不仅仅是使用符号以如其所是的形式表征世界。相反,世界仅展现被我们揭示出来的一面,这种认识世界的方式深深根植于作为有机体的我们的进化和表现的需求之中。自然「自然并非仅使用大脑构建了理性,还使用了包含大脑的身体。」神经科学家 Antonio Damasio 在其对认知科学产生巨大影响的《笛卡尔的谬误》一书中这样写道。换句话说,除了大脑,我们还用身体思考。
我猜想身体的存续在一个不确定的世界中是基本而又至关紧要的,这构成了人类智能的灵活性与能量的基础。但是很少有人工智能研究者真正意识到这些见解的意义。绝大多数算法的目的在于从大量的训练数据集中推断模式——因此算法在看了数百万甚至数十亿只单个猫的照片之后才能精确地识别猫。与之相比,为了满足作为有机体的需求,人类的身体包含有极其丰富的模型以应对外部环境。从相对较少的被观察样本中我们就可以总结经验做出预判。因此当人类在思考一只猫时,她很可能描画猫行走的方式,听到咕噜咕噜的声音,感受到猫伸出爪子就要抓挠。在其理解「猫」这一概念时,人类有着丰富的感知信息,并且其他相关概念也有助于其理解。
这意味着当人类解决一个新问题时,绝大部分的困难工作已经完成了。通过这种我们刚刚开始理解的方式,由细胞进化而来的身体和大脑,已经构建了一种世界模式,使我们可以及时应对各种挑战。但是对于人工智能算法,每一次都是从头开始运行。有一个活跃而重要的研究路线,其被称为「归纳迁移」,致力于利用机器先前学习的知识解决新问题。然而,照目前来看,人们仍然质疑这种方法是否可以获取一些像丰富的身体模型般东西。
转载请注明出处。