近年来,人工智能迅猛发展,即便是没有深入了解过人工智能技术的人,想必也或多或少地听过两个术语——符号人工智能和神经网络。随着人工智能的发展不断成熟,MIT-IBM 沃森人工智能实验室主任 David Cox 认为,如今人们需要重新审视人工智能,他提出将上述二者结合,开发一种「神经符号人工智能」(Neuro-Symbolic AI)。
本文将详细介绍神经符号人工智能背后的原理,作者为英国科技作家 Luke Dormehl,雷锋网在不改变原意的基础上对原文进行了编译。
想象一下,一个托盘上有 8 个物体:有立方体,有球体,材质不同,大小不一。那么我的问题是,托盘上的大件物体和金属球的数量是否相同?
你可能会感到不解,觉得我的问题有点儿刁钻。相反,这并不难,甚至学龄前儿童都能轻松回答。但对于当今最先进的神经网络来说,这太难回答了。因此,即使人工智能对我们来说已经再熟悉不过,它还是需要重新开发。
以上并非我的观点,而是美国马萨诸塞州剑桥的 MIT-IBM 沃森人工智能实验室(MIT–IBM Watson AI Lab)主任 David Cox 的观点。早前, David Cox 是哈佛大学教授,他的团队凭着对神经科学的洞见,建立了一个受大脑启发的机器学习计算机系统。目前,在 IBM,他主要负责沃森人工智能(Watson A.I.)的相关事务。
提到沃森,不了解的人只知道它是人工智能,曾在美国问答节目《Jeopardy》中一战成名。但其实,沃森首先是一个机器学习系统,通过大量数据而非人为规则接受训练。
说回主题,在人工智能准备在未来十年大放异彩的时候,David Cox 说世界需要重新审视它,这听起来是有点儿奇怪。毕竟,过去十年可以说是人工智能史上最成功的十年——这十年里,几乎每周都会有新突破,没有任何“人工智能寒冬”的迹象。但这也正是他认为人工智能需要改变的原因。
对此,他的建议是一个目前还不确定的术语——“神经符号人工智能”——这也很可能会成为 20 年代结束时大众熟知的一个词。
符号人工智能的起与落
严格地说,神经符号人工智能不是一种全新的人工智能,而是把建立“会思考的机器”的两种现有的、相互对抗的方法相结合。
这个名字中的“符号” 指的是创造人工智能的第一种主流方法。从 20 世纪 50 年代到 80 年代,符号人工智能是至高无上的。对于一个符号人工智能研究者来讲,所谓智能,是建立在人类通过形成内在的符号表征来理解周围世界的能力之上的。然后,研究者制定规则处理这些符号表征,而这些规则可以通过捕获日常知识的方式被形式化。
如果说大脑类似于计算机,那么不论我们遇到任何情况,都需要运行自身的计算机程序,因为程序会一步步地解释如何完全基于逻辑来执行操作。因此,符号人工智能研究者认为,如果是这样,他们也能够发现那些关于世界如何组成的相同规则,然后以算法的形式编码,以便计算机执行。
实际上,符号人工智能在过去表现不错,令人印象深刻。1964 年,计算机科学家 Bertram Raphael 开发了一个 SIR 系统,即“语义信息检索”(Semantic Information Retrieval)。SIR 是一个计算推理系统,它似乎能够以一种类似于真正智能的方式来学习对象之间的关系。比如,你告诉它一些基础信息——John 是个男孩,男孩是人,一个人有两只手,一只手有五个手指。然后你问他 John 有几根手指,它的答案是 10。
20 世纪 80 年代,见证了基于符号人工智能的计算机系统达到顶峰、跌落谷底。那是所谓的”专家系统”的十年,“专家系统”试图使用基于规则的系统来解决现实世界的问题,例如帮助有机化学家识别未知的有机分子,帮助医生为传染病患者推荐正确剂量的抗生素等等。
雷锋网了解到,“专家系统”的基础坚实,但也存在问题:这些系统价格昂贵,需要不断更新;而最糟糕的是,规则越多,系统的准确性就越低。
神经网络的世界
那么,我们再来看看神经符号人工智能里的“神经”是什么?
实际上,“神经”指的是深度学习神经网络,它是受大脑启发的计算类型,驱动了过去十年许多人工智能领域出现的突破——比如人工智能驾驶汽车、把文本翻译成几十种不同的语言、智能音箱能够听懂指令等等。
神经网络与符号人工智能的工作方式不同。因为神经网络由数据驱动,而非基于规则。
具体来讲,向一个符号人工智能解释,即明确地向其提供保证正确识别的所有信息。打个比方,想象一下让朋友帮你去汽车站接你母亲,你需要提供一套规则描述她,以便让你的朋友从人群中认出她。但是如果要训练一个神经网络去做这件事,你只需向它展示多张你母亲的照片。要是它足够聪明,不仅能够识别出你母亲,还可组成现实世界中不存在的与她相似的对象。
正如 David Cox 对《数字趋势》杂志所说:
不可否认,深度学习神经网络带来了惊人的进步,但同时也出现了一些问题,令人担忧。
实际上,David Cox 提到的问题恰恰依赖于让今天的神经网络变得如此强大的东西——数据。就像人一样,神经网络是根据例子学习的。但是,一个人可能只需根据一两个例子就能正确地记住一件事,但人工智能需要更多例子。同时,准确性的高低取决于是否具有大量的注释数据,因为学习每个新任务都基于这些数据。
燃烧的交通灯
正是因为神经网络的上述特点,它们并不擅长“黑天鹅”问题,由 Nassim Nicholas Taleb 提出的黑天鹅事件在统计学上是罕见的。David Cox 表示:
目前许多深度学习解决方案尽管非常惊人,但都基于二八定律(雷锋网注:这一定律认为在任何一组东西中,最重要的只占其中一小部分,约 20%,其余 80% 尽管是多数,却是次要的)。深度学习在 80% 的情况下是对的,但重要的实际上占少数。如果你看到一个物体本不该处于目前所在的位置,或者方向有点奇怪,这种情况下,即便是再惊人的系统,也起不了作用。
在加入 IBM 之前,David Cox 与别人共同创办了 Perceptive Automata 公司,为自动驾驶汽车开发软件。该团队在他们名为 Slack 的频道发布了数据收集过程中偶然发现的有趣图片。其中一张照片是在十字路口拍的,照片上的交通灯着火了,对此 David Cox 表示:
这真是一辈子难遇的事情。我不知道 Waymo 和 Tesla 在训练神经网络的数据集中是否有交通灯着火的图像,但我敢打赌,就算他们有,数量也会很少。
其实,这就是一件无关紧要的事,因为它很少发生,即便发生了,也并不是很紧要。如果系统推荐一个人去了一家很糟糕的餐厅,这样自然不太好,但可能还不足以毁掉他的一天,只要系统以前提出的 99 条建议都是不错的,就没必要特别沮丧。
但是,如果一辆自主驾驶汽车在十字路口面对燃烧的交通灯或一辆马车不能做出正确的反应,后果则不堪设想。这可能是小概率事件,但我们也希望它能够很好地应对这类情况。
David Cox 解释说:
如果有能力推理、判断,我们就能轻松应对。如果我看到交通灯着火了,我最起码会有一些基本判断,比如目前不能根据交通灯判断我是该停还是该走,但我知道要注意安全,因为周围的司机也会感到困惑。但我可以根据另一个方向行驶的车辆判断接下来的行动。在这种以安全完成任务为关键的环境中,深度学习还不能很好地服务我们。这就是我们需要其他解决方案的原因。
将逻辑与学习相结合
因此 David Cox 便提出了神经符号人工智能的想法。
所谓神经符号人工智能,其实就是把以上方法结合起来,把学习和逻辑结合起来。
神经网络可以帮助符号人工智能系统变得更聪明——通过将世界分解成符号,而不是依靠人类程序员来为它们做这件事。同时,符号人工智能算法可以结合常识推理和行业知识,并运用到深度学习中。这些都会使人工智能更好地处理从自动驾驶汽车到自然语言处理的一切复杂任务,同时训练所需的数据也要少得多。
David Cox 说:
神经网络和符号化的概念之间,存在着非常完美的互补关系。因为神经网络可以给你答案,将混乱的现实世界变成一个系统性的符号表征,在图像中找到所有关联。只要有了这种符号表征,就能在推理方面有所突破。
就像文章一开始提到的托盘上的物体的例子,神经符号系统利用神经网络的识别能力来识别对象,然后再依赖符号人工智能应用逻辑和语义推理,从而发现新的关系。这样的系统实际上已经被证实可以有效工作。
同时,这不仅适用一小部分情况,越来越重要的是,人工智能系统在必要时是可解释的。神经网络可以非常好地执行某些任务,但它的许多内部推理是“黑箱”式的,对于那些想知道它是如何做出决定的人来说是难以理解的。
同样,如果一个机器人在音乐流媒体平台 Spotify 上推荐错误,其实并不太重要。但是,如果你被拒绝银行贷款,被拒绝工作申请,或者有人在涉及自动驾驶汽车的事故中受伤,我们则需要了解为什么人工智能会提出相关的建议。这个时候神经符号人工智能便能派上用场了。
人工智能研究的未来
几十年前,符号人工智能和神经网络还是完完全全的两个世界,相互对立。人工智能领域的大佬们常常各执一词,在支持一种方法的同时,必将否定另一种方法。实际上,他们的做法未必不妥,毕竟资金有限,要解决同样的问题,两派必定会竞争。而如今看来,情况似乎正好相反。
另外,David Cox 还表示:
看到年轻一代真的很有意思,我团队中的很多人都比较年轻,有的刚刚博士毕业,对这个领域保持着新鲜劲儿和兴奋感。他们没有经历过符号人工智能和神经网络相互对立的时代,也不在乎二者曾经对立过——其实这种不在乎就非常好,因为它能让人打开心扉,消除偏见。他们很乐意探索未知,用人工智能做点很酷的事。