潘云鹤
(中国工程院,北京,100088)
人工智能从诞生之日起,就把机器人的研究纳入其视野之中,自20 世纪70 年代以来,人工智能一直有7个比较固定的领域,包括机器定理证明(逻辑和推理)、机器翻译(自然语言理解)、专家系统(问题求解和知识表达)、博弈(树搜索)、模式识别(多媒体认知)、学习(神经网络)、机器人和智能控制(感知和控制),这些领域分别针对人的不同智能。在研究与发展过程中,人工智能也形成了很多学派,如符号学派、连接学派、行为学派。
在上述7 个重要的研究领域中,前6 个都是模拟人的思维能力,第7 个是模拟人的行为能力,因此AI 1.0在其发展过程中改变了两件事情,一是模拟识别,二是模拟行为。众多学派中的符号学派与连接学派对应着模拟识别,行为学派对应着模拟行为。然而模拟识别与模拟行为并非完全独立,模拟行为的研究需要依赖模拟识别,但在AI 1.0 期间,模拟识别主要为符号处理,从最初的逻辑处理到后来的知识处理。
2017 年7 月,国务院印发了《新一代人工智能发展规划》,明确了我国新一代人工智能发展的目标。在新一代人工智能发展期间,我国提出了人工智能发展的5个新领域,包括大数据智能、跨媒体智能、群体智能、人机混合增强智能和自主智能系统。其中,大数据智能、跨媒体智能、人机混合增强智能这3 个概念是中国提出的,但很快,跨媒体智能研究便转变为多模态智能研究。模态和媒体大部分是类似的,但是也有不尽相同的地方,媒体指的是传感器和人都能够识别的信息,模态主要是指传感器的信息。传感器的很多信息人未必能够识别,比如,“微波信息”人就识别不了,只有把它转换为图形,才能被人所识别,而转化为图形就是机器和人之间的一个媒体。
在上述5 个新的研究领域中,模拟识别与模拟行为各占一半。人机混合增强智能、自主智能系统、群体智能的部分内容就是模拟识别。因此人工智能从1.0 向2.0发展的过程中,扩展了模拟行为的智能部分,究其根源,是人工智能越来越注重开拓多样化的应用领域,包括智能城市、医疗、制造、农业等方面。
1.2.1 从机器人拓展到智能自主机器
智能自主机器的概念是将机器人的概念与无人机的概念融合在一起生成的。近20 年来,机器人的发展速度飞快,但比机器人发展更快的是无人系统。图1 所示为美国各式军用无人系统。
图1 美国各式军用无人系统
美国各式军用无人系统,有不同大小的,有用于海面飞行的,也有行走式的。其中无人机发展速度更快,在此次乌克兰战争中,其表现出了非常强大的功能。
与此同时,民用的无人系统也在不断发展,取得了长足的进步,包括海面上游的、海里游的以及海底游的,都带来了非常巨大的影响。
1)“无人机+AI1.0 机器人”到智能自主机器
无人机的概念加上机器人的概念,转化出来的新概念就是智能自主机器。智能自主机器可以去模拟人,这便是机器人,也可以拟狗、拟禽、拟鱼。之江实验室研发了模拟深海游动的机器鱼,曾登上 《自然》科学杂志的封面(图2)。
图2 之江实验室研发的拟鱼机器人
将智能自主机器的概念融入一般的机械当中,便可以研究智能机床、注塑机、挖掘机、塔吊、叉车等。目前很多数控机床已经开始了智能化的研究,智能叉车已经在杭州出现,塔吊也开始应用到许多智能场景当中。
2)智能自主系统:智能自主机器+智能自主仪器
智能自主机器与智能自主仪器构成了真正的智能自主系统。既然机器能够智能化,为什么仪器不能智能化呢?笔者认为,计算机断层扫描(CT)机可以智能化,核磁共振可以智能化,显微镜也可以智能化,所以在未来的十年间,仪器的智能化将是一个非常重要的发展前景。
1.2.2 人机融合增强智能
目前,各类的穿戴设备、人-车共驾、脑控或肌控外骨骼机器人、人机协同手术等实现了生物智能系统与机器智能系统的紧密耦合,在外科和脑手术中已经开始使用,机器人在康复的过程中发挥了非常重要的作用。
1)人机融合增强智能技术在盲人设备中的应用
导盲犬对于盲人来说非常重要,于是美国人开始尝试用波士顿动力公司的机械狗替代导盲犬。这类似于在导盲犬前面安装了摄像头,盲人牵着它就可以行走。然而在杭州世界工业设计大赛中,有研究人员设计出了盲人眼镜,作为盲人的眼睛,其配备有两个摄像头和两个耳机,能够将看到的东西转换为声音告诉盲人,遇到台阶时,用信号告诉盲人台阶是向上还是向下。
这副眼镜在首次比赛中,还只能通过不同的声响作为声音信号进行传递,一年后,盲人眼镜已经可以将不同的声响更换成语音播报,此时的盲人眼镜不但可以导盲,还可以看报,主要是利用光学字符识别(OCR)技术对报纸的文字内容进行识别,进而转换成声音。此外,将该眼镜与导航系统结合,它还能告诉用户回家的汽车站位置。
2)人机融合增强智能技术应用分析
上述应用案例分析说明,从技术方面进行比较,机械狗的技术相比盲人眼镜要更高,但从实用性与实惠性方面考虑,盲人眼镜要更胜一筹。笔者认为,在从事用智能化设备和智能化解决问题的时候,应该要有更广阔的视野。盲人眼镜用的就是跨媒体智能,将视觉智能成功转换为听觉智能。
1.2.3 群体智能系统
当下,群体智能系统展现最为普遍的是无人机的各种表现。2022 年广州曾进行无人机群的表演,几百个无人机在天上排列出各种图案(图3)。
图3 无人机群表演
最近,浙江大学自动控制学院研发的“丛林自主集群飞行机器人”,在非常复杂的环境下可以迅速飞行、低空飞行,还可以围绕着变化的目标进行飞行。这样的机器人,雷达看不到,导弹也打不到,而且在复杂环境中(例如大城市)能够非常方便地进行追踪。该飞行机器人的智能设备系统水平非常高,即使障碍发生变化、人在环境中随机穿越、随机的人员干扰等都不会影响机器人的追踪。
把各种各样的智能个体、自主智能系统结合在一起,不是同构而是异构。无人码头、无人矿山、智能车间,这些都是今后重要的发展方向。但是,智能自主系统工作的最高水平并不是无人环境,而是有人环境,比如开放式码头、智能交通等。
事实上,无人码头并不是最复杂的环境,开放式的智慧码头更胜一筹。以宁波港为例,在港区的生产指挥端,通过一块搭载了“智慧大脑”的屏幕,港区的生产运营全貌便可“尽收眼底”,可实现效率的监测分析和配置预控。
城市的智能交通之所以难,是因为它是有人环境。因为在有人环境中的智能自主机械,不仅要求能识别环境、规划行为,而且要求能预判突变,防止伤害。人是非常善于变化的,并且不同情绪的人,变化有时候可以超出常规,会造成人的伤害,而人又是最容易受到伤害的,所以未来就应该研究在有人环境下的智能自主机械应该如何进行运作,这不仅在智能交通上有需求,在智能加工部门也同样需要。
产品的智能化是人工智能用于工业化崛起的另一个需求。人类的发展经历了四轮大变革:第一轮是动力机械化,人类有了大工业;第二轮是电力电网化,使人类的生活进入了一个更光明、更美好的新时期;第三轮是电子信息化,人们使用电路、电子线路,拥有了电脑、收音机、电视机;当前,正处于第四轮变革——数字智能化。相较于第三轮基于硅片的电子信息化变革,数字智能化的变革是以数据和知识为基础,数据、知识、模型、平台是第四轮变革发展的重要生产要素。
在第四轮变革中,人工智能将广泛地和工业生产的各个部门结合起来。如图4 所示,为保证人工智能与企业的顺利结合,需要关注五个关键点:第一个关键是生产过程的智能化,这是工业机器人的关注要点;第二个是企业运作的智能化,这直接关系到大数据的处理;第三个是产品创新的智能化,这一过程在过去的关注度不够,因为过去的产品大部分是模仿世界上的先进水平,但是现在从智能眼镜可以看到,产品是在不断走向创新;第四个是商业模式的智能化;第五个是供、销、创造链智能化,党的二十大报告提出,要推动创新链、产业链、人才链、资金链深度融合(简称“四链融合”),说明对该问题的重视程度也越来越高。
图4 企业智能化五个关键点
在中国,产品创新发展的速度尤其是智能产品出现的速度是非常快的,但这一点往往被许多企业所忽视。杭州每年举办的“工业设计大赛”(目前已更名为“创新设计大赛”)已持续十多年,其包含产品奖和创意奖两个奖项。前者是指已经面向市场获取一定利润的产品,后者是指已经完成生产但尚未进入市场获得利润的产品。作为该项赛事一直以来的评委会成员,笔者指出,随着时间的推移,获奖内容发生了巨大的变化。
通过对比2015 年与2021 年的“产品奖”的获奖情况,作为2015 年金奖的电动平衡扭扭车与银奖的水槽式洗碗机、吉利博瑞的汽车,都是非常典型的工业设计的内容。而2021 年金奖则是“基于人工智能驱动的智慧城市管理平台”,这是将人工智能用于城市管理,城管的40 多个项目都可以采用人工智能;两项银奖颁给了“频闪阶梯照明缺陷检测系统”和“蚂蚁链鹊凿数字版权服务平台”。6 年间,杭州的产业发生了巨大的变化,这是一个值得关注的变化潮流,传统企业如果不追赶这一潮流,就会有落后的巨大风险。
相比“产品奖”,“创意奖”获奖内容的变化更为惊人。在2015 年,“创意奖”的金奖是中国美术学院的立体故事书,这是翻开能够自动立起来的儿童用书;银奖分别是大连民族大学的城市医疗信息交换(HIE)系统和豌豆荚净化槽设计。而到了2021 年,金奖颁给了“智能物体表面侦测系统”,银奖分别是“犀牛智造数字化工厂建设项目”和“工业级增强现实移动终端”。
在产品全面转向智能化的同时,获奖的单位也发生了变化。此前的获奖单位以大学为主,但6 年后,“创意奖”的获奖单位已经不再有大学,全部奖项都被各家企业收入囊中,这对于传统的工业设计毕业的学生而言,是十分困难的。那么产品应该如何实现智能化呢?笔者提出了两个方向。
产品智能化实现主要有两个方向:一是“产品+智能自主系统”;二是“产品+大数据智能”。
2.2.1 产品+智能自主系统
以智能超声仪为例,智能超声仪的技术特点包括:①针对甲状腺、乳腺等浅表器官;②模仿医生进行6 个自由度扫描;③采用了AI 软件,在扫描时自动识别与标记可疑病灶,并对可疑处进行更细致的诊断流程。另外,2019年3 月20 日,其被杭州西湖区人民代表票决为区政府“十大民生实事”之一。
目前,人工智能在医学领域的应用主要是智能读图。浙江大学数学系的孔德兴教授所研究的超声读图装备,曾参与CCTV 全国首届超声AI 读片大赛,其正确率和速度远超人类医生。该装备实际上是将智能化的思维模拟,转化到去改造超声仪,在智能超声仪的基础上加上机械臂,通过机械臂进行扫描,同时进行识别。相比扫描后的图像识别,该装备对可疑病灶的扫描更加详细。
2.2.2 产品+大数据智能
以好络维公司的便携式智能心电图仪为例,便携式心电图仪能够将心电、血液、血氧、心理、睡眠、体温等数据通过传感器连接到传感器系统中,该产品作为一种个人穿戴式设备,能够将记录仪佩戴在手上。在对心电图的电波进行人工智能识别以及对核心软件进行升级改造后,设备实现30 大类204 项异常心电图的自动分析辅助诊断,准确率达到86%,已然是中上医生的水平。
在将产品出售的过程中,企业发现购买产品的人都希望和医生进行联系,在大量用户(医生与病人)所聚集的大数据的基础上,搭建起一个心电的云平台,继而实现了从制造业向制造服务业的成功转化。
本文从人工智能的角度来看行为智能,又从人工智能发展的需求角度来看产品智能。如果把行为智能和产品智能进行模块化,能够发现得出的智能模块是十分类似的,大致可以分成7 类:①感知;②记忆;③思维计算;④自主控制;⑤合作协调;⑥通讯交互;⑦管理调度。这7 类智能模块的不同组合可以出现千变万化的行为,满足千变万化的行为智能,也可以满足千变万化的产品智能化。
2023 年3 月,杭州举办了全国工业芯片大会,惊喜地发现上述分类和工业芯片的分类十分吻合。工业芯片把芯片分为8 类:传感芯片、模拟芯片、主控芯片、人工智能芯片、存储芯片、通信芯片、安全芯片、射频识别(RFID)芯片。其中RFID 芯片是一种特殊的传感芯片,若将RFID 芯片与传感芯片合在一起,工业芯片的分类可归为7 类。笔者认为,当前中国的一个重要的任务是要把两者结合起来加以规划和研究。
综上所述,笔者认为,人工智能中的智能机器人、无人系统、产品智能化三者在智能技术上是相通的,是殊途同归的。三者的协作发展,将有利于模块化、芯片化、标准化的发展,从而扩大规模、降低成本、提高质量。如此以来,便能够实现习近平总书记最近指出的“要发挥人工智能在产业升级、产品开发、服务创新等方面的技术优势,促进人工智能同一、二、三产业深度融合,以人工智能技术推动各产业变革,在中高端消费、创新引领、绿色低碳、共享经济、现代供应链、人力资本服务等领域培育新增长点、形成新动能。”