陈 霖
中国科学院生物物理研究所 北京 100101
我们必须开展什么样的新一代人工智能的基础研究,才能使我国成为人工智能领域真正意义上的科学大国?像图灵的计算模型,回答了 “什么是计算”的问题,奠定了整个计算机科学的基础;像香农的通信数学原理,回答了“什么是信息”的问题,奠定了现代信息论的基础。对于我们而言,关键是能否提出 “什么是新一代人工智能”的核心基础科学问题,以及我们究竟有什么能力和基础来建立回答这样问题的原创系统理论。
总结近 40 年从事认知科学研究的经验,我们认为,发展新一代人工智能的核心基础科学问题是:“认知和计算的关系”。例如,要回答“人工智能会不会取代人类智力”这个广泛关注的问题,凝炼成科学问题,本质上是要回答“认知和计算的关系”(或者“认知和计算的差别”)问题。
认知和计算的关系问题可以进一步细化为 4 个方面的关系:① 认知的基本单元和计算的基本单元的关系;② 认知神经表达的解剖结构和人工智能计算的体系结构的关系;③ 认知涌现的特有精神活动现象和计算涌现的特有信息处理现象的关系;④ 认知的数学基础和计算的数学基础的关系。
研究任何一种过程,建立任何一种过程的科学理论,必须首先回答一个基本问题:这种过程操作的基本单元是什么?每门成熟的基础科学都有其特定的基本单元, 如高能物理学的基本粒子、遗传学的基因、计算理论的符号以及信息论的比特等。对于认知科学而言,必须回答:什么是认知过程操作的基本单元?
认知科学的大量实验事实表明,认知的基本单元不是计算的符号,不是信息的比特。例如,根据记忆的实验,Miller 提出计量工作记忆大小的单元不是计算机计量记忆大小的比特,而是一种整体性的“组块”(chunk)。人类的工作记忆可以记住 4 个组块。一个组块可以是一个字母、可以是多个字母组成的词,甚至可以是多个词组成的短语,它们显然具有非常不同的信息量比特。再如,Kahneman 提出注意选择的基本单元是整体性的“知觉物体”。还有,Poepple 提出时间组织的基本单元是整体性的“时间格式塔”。“组块”“知觉物体”“时间格式塔”,这些关于认知基本单元的概念的重要性在于,它们不是借用于计算理论或信息科学,而是原创于认知科学的实验发现。
目前的关键问题是,如何超越直觉的理解,科学准确地定义这些认知基本变量,从而建立这些基本变量的统一的认知基本单元模型。这对于理解“认知和计算的关系”,把新一代人工智能建立成一门成熟的基础科学(Poggio 认为的“从炼金术转化成化学”),具有重要的基本意义。
脑成像(brain mapping)不是指成像技术,而是指大脑功能解剖结构的一种学说,即智力的模块性:大脑是由专司某种认知功能、结构和功能相对独立和分离的多个脑区组成的。这样的模块性结构,跟通用计算机的中心处理器和统一记忆存储器的计算体系结构是不相同的。
我们进一步提出认知神经表达的解剖结构的概念,这是因为近来我们发现,敲除了视杆、视锥细胞只保留内生感光神经节细胞(ipRGCs)的盲鼠,能够检测拓扑性质。而且 ipRGCs 对一致地识别拓扑性质既是充分的,又是必要的。ipRGCs 只是视网膜的一种神经节细胞,又分成 5 个子类,而且这 5 个子类中只有 2—3 类涉及识别拓扑性质。这样的神经表达实验表明,大范围首先的拓扑性质知觉起源和根源于一种形态、投射关系、分子特性特定的细胞。然而,人工神经网络的每个“细胞”是相同的,只是连接不同。
如果说,深度学习是来自神经系统层次结构的启发,那么起源于特定神经细胞的、超越脑区成像的全脑成像,必将为发展新一代人工智能的计算体系结构,提供深刻得多和丰富得多的启发。
基础科学面临四大问题:物质的本质、宇宙的起源、生命的本质和智力的产生。这四大问题的前 3 个基本上是关于物质世界的研究;而智力的产生是对精神世界的研究。认知科学研究智力的产生,就是要揭示人类认知精神世界涌现的特有的现象。正如 McClleland 认为的“人类认知最伟大的主要成就是认知涌现的现象”,理解认知的涌现是对符号处理的认知计算理论的深远的挑战。
意识正是认知涌现的特有精神活动现象的一个典型。意识研究的困难在于,如何把人工智能是否会产生意识之类的直觉思辨的讨论,变成科学实验的研究。
在意识的科学研究中,我们提议如下 4 个方面来比较研究和分析“认知和计算的关系”:① 意识的认知机制——什么是意识?② 意识的神经表达——意识是如何在大脑中产生的?③ 意识的进化——意识是如何起源于进化的?④ 意识异常——精神疾病的本源是什么?
无论是经典的计算理论还是目前流行的贝叶斯计算理论,都认为认知过程是图灵意义的离散符号的计算。也就是说,计算的数学基础是图灵机。
跟传统的、目前仍然占统治地位的认知计算理论不同,我们提出,体现在不同认知层次的认知基本单元(如组块、知觉物体、时间格式塔等)的共同本质——同一不变性和整体性——可以定义为容限空间上的大范围拓扑不变性质。各个认知层次(包括知觉、注意、学习、记忆、数的认知、发展和进化、情绪、意识)的实验,一致支持了这个 Wolfe 称为“大范围首先”的认知基本单元的拓扑学定义。“大范围首先”的容限空间的拓扑学,不像是图灵机。
目前流行的基于计算概念的理论数学,不能满意地解释我们发现的诸多亟待解释的基本认知现象,如“大范围首先”、不变性的直接知觉、认知偏向、意识涌现,以及起源于 ipRGCs 的拓扑性质分辨等。我们正在提出和发展适合描述认知的新的数学框架,包括“大范围首先”的数学基础:用 Minsky 的 Perceptron 平行计算模型奠定分析高复杂性拓扑性质计算和“大范围首先”拓扑性质知觉关系的数学基础,用 Zeeman 的容限空间代数拓扑学(同调论)奠定“大范围首先”的知觉组织的数学基础,用 Klein 的 Erlangen 纲领奠定“大范围首先”的不变性直接知觉的数学基础;包括认知基本单元(概念格的“知觉物体”刻画)、认知基本关系(半序的“容限”表征)、认知基本操作(泛拓扑的认知过程描述)的数学。近来我们寻找在大脑中实现“大范围首先”的量子模型,通过张量代数可以获得一些量子理论的构成要素。认知和计算的关系的研究使得数学与认知在各自最本源地方相汇,这正是把炼金术转化为化学,对新一代人工智能的数学基础的探索。
认知和计算关系的问题需要长期探索,应当得到持续的支持。就认知科学的学科特点,建议注意 3 个方面的布局。
(1)重视认知层次的新变量、新概念和新原则的研究。目前脑科学发展的一个趋势是,一方面脑和神经系统的生物学的数据前所未有地大量涌现,另一方面计算的、物理学的概念越来越普遍借用到认知过程的分析。但是一个相对被忽视的问题是,如何在认知心理的层次来理解这些空前丰富的生物学层次的数据?这样的问题超越了生物学和信息科学的层次,必须要有认知科学层次的、适合描述认知的新概念和新原则来回答。
(2)人类为主,动物为辅;宏观为主,结合微观。人工智能的基础研究应当强调系统和行为层次。
(3)以实验为基础的学科交叉。我们的一个基本出发点是,物理、计算的基本并不一定意味着认知的基本,适合描述物理世界的变量并不一定适合描述认知世界。认知和计算的关系的问题,如“什么是认知基本单元”的问题,不能单靠物理的推理或计算的分析来解决,根本上只有通过实验来回答。在这个意义上,认知科学本质上是实验的。因此,人工智能的基础研究要特别注重认知科学的实验研究,要注重实验为基础的空前多学科的交叉。