人工智能的下一步突破—多学科交叉内禀

2020-03-06 13:48庄越挺蔡铭李学龙罗先刚杨强吴飞
工程 2020年3期
关键词:参与方材料模型

庄越挺,蔡铭,李学龙,罗先刚,杨强,吴飞

a College of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China

b School of Computer Science, Northwestern Polytechnical University, Xi'an 710129, China

c Institute of Optics and Electronics, Chinese Academy of Sciences, Chengdu 610209, China

d Department of Computer Science and Engineering, Hong Kong University of Science and Technology, Hong Kong 999077, China

1. 引言

人工智能(AI)是以机器为载体实现的人类智能。支撑AI发展的相关技术在过去20多年取得了较大发展,推动了AI在语言理解、视觉识别和智能数字助理等领域的成功应用。虽然当代AI系统在特定的预定义任务方面表现甚优,但它仍然无法从数据或经验、直觉推理和功能适应性等方面进行独立学习。为了克服这些不足,我们需要从学科交叉角度来推动AI的发展。因此,AI的下一个突破需要我们在学科交叉方面进行努力,这就要求我们要利用神经科学、物理学、数学、电子工程学、生物学、语言学和心理学等来实现AI的重大理论、技术和应用创新,以及解决复杂的社会问题和重塑国家工业体系等。

2. AI走向外太空

AI业已成为人类探索宇宙的重要使能技术。从第一张黑洞图片合成、太阳耀斑预测、月球表面地图绘制、宇宙中外星智慧生命的搜寻,再到暗物质研究,都离不开AI对海量数据的深度挖掘与分析能力[1]。与此同时,AI也正在为各类在轨飞行任务赋能助力。

AI使空间探测器变得更独立、更可靠、更自主。例如,美国国家航空航天局(NASA)的“洞察”号(InSight)火星探测器在从穿越火星大气层到降落至火星表面的过程中,由于测控信号微弱、通信延迟,使得地面无法对其进行远程控制,所以为了成功着陆,InSight必须自主地执行数十项操作,并且要完美地完成这些操作。在NASA的下一个火星探测计划中,AI将被用于进行轨道和有效载荷优化[2]。

AI有助于加快卫星的“智能化”演变。Lockheed Martin研发了“SmartSat”,它是一种采用软件定义的卫星架构,该架构允许用户通过软件更新来改变在轨卫星的任务。这种软件定义的解决方案不仅提高了卫星的灵活性和智能性,而且其可重复使用性也降低了卫星的运行成本,然而,这是传统的硬件定义的卫星所无法实现的。另外,一系列编队飞行的智能卫星可以建立一个分布式AI平台,这些卫星可同时进行在轨学习训练、快速部署、在线推理和智能计算,使得更多的工作被直接在太空完成,而不需要被传回地面进行处理,这极大地提高了太空任务的运作效率,减少了通信成本。

太空探索之旅充满了未知和不确定性。当前在轨运行飞行器的控制逻辑主要依赖于针对所有潜在场景的预编程系统,而该系统无法灵活应对新的、不可预见的情况。通过引入新型的机器学习(ML)机制[3],这些系统在在轨运行期间有望能够持续自主学习、不断适应新的任务和环境,并将已有的学习能力应用于新的场景,从而更好地完成自主任务规划、自主健康管理以及在轨载荷数据处理等任务。此外,通过故障智能自修复技术[4],这些系统也有望降低故障与异常处理的人工干预次数,从而实现全任务过程中故障识别、隔离、处理和效果评估的自动闭环流程。

3. AI与医疗保健

“忽如一夜春风来,千树万树梨花开”,AI似乎在各个领域突然产生了强烈的“绽放”(blooming)效果。ML作为AI的核心,其在理解和利用海量数据方面取得了长足进步。最近,AI领域在计算能力及大量数据处理方面也取得了一定进展。由于医疗保健和医学领域所产生的巨大的数据量,以及医疗设备和数字记录系统的不断涌现,AI在医疗保健和医学领域[5]更是得到了有效的发展。目前整个医疗系统越来越多地采用了大数据处理方法,相关数据经处理后可形成不同的表现形式,进而形成更多基于证据的健康决策。

AI除了对人类健康有积极影响,其在基因组学领域也起到了推进作用。AI系统使基因测序和分析变得更高效、更准确[6]。此外,AI已从根本上改变了分子生物学和遗传学领域的预测功能[7]。因此,研究人员可以预测未来某个生物体可能会遭遇哪些风险、哪些基因突变可能会导致不同的疾病,以及如何为未来做好准备。通过了解构成该生物体所有活动的特定遗传框架,并借助AI的支持,我们可预见AI在农业、畜牧业和遗传疾病诊断等领域的作用将是开创性的。

在第四次工业革命的浪潮中,我们更无法忽视AI和区块链[8]在医疗保健方面的作用,即AI融入了第四次工业革命的基因中,而区块链将会改变整个经济体系的基础架构。由于这两种技术的共同作用可以决定工业革命的深度和广度,因此AI与区块链的协同作用表明AI可以更有效地实施区块链相关技术。基于AI对各个领域所产生的影响,它注定要为我们的时代注入一种自我更新的能力与磅礴的生命力。

4. AI与新材料设计

利用AI辅助新材料设计对未来人类社会的发展也具有重要意义。历史上,新材料的发现及应用通常需要漫长的时间。2011年,美国奥巴马政府开始实施“材料基因组计划”(Materials Genome Initiative, MGI),其目标是将先进材料的发现、开发、生产和应用周期缩短至原来的一半以上。近年来,随着MGI和大数据的融合,数据驱动的研究模式被认为是最有前景的材料研究范式,其中AI是处理材料大数据并获得“成分-结构-工艺-性能”关系的关键技术。

近年来,由于ML不断展现出的应用潜力,其已被学术界视为是可以革新材料科学的技术。例如,历史上化学元素周期表的完成花费了许多杰出科学家一个世纪的时间,而现在借助AI技术,人们可能只需几个小时就可以从数据中重构周期表。基于大量已知的化合物和材料数据库,无监督的Atom2Vec机器可以自主学习原子的基本特性,并结合神经网络可以高精度地预测新材料的详细特性[9]。在药物合成方面,Segler等[10]通过引入AI符号来寻找逆合成分析的路线。同传统的计算机辅助搜索方法相比,该方法的搜索速度是原来的30倍,而由其产生的分子数量是原来的两倍。值得一提的是,该神经网络的训练数据集既包含了有效数据也包含了无效数据,这与传统的基于有效数据的数据集明显不同。

除了用于合成新材料,AI也促进了人工结构材料(即超材料)的发展,人工合成材料的等效材料参数由其结构尺寸和组成成分决定[11]。由于人工结构材料中结构几何形状和基本材料的变化范围远远超过传统试错法的能力,所以,我们必须借助大数据技术去优化设计。另外,由于光子速度远大于电子速度,且无源光学元件不需要电源,基于结构材料的新型光学计算技术有望显著提升深度学习的数据处理速度并降低其功耗[12]。

5. AI与海洋深地

AI在海洋资源的开发中也起到了越来越重要的作用。在大航海时代的驱动下,发达国家在此方面拥有强大的战略优势。地球上海洋面积约占地球表面积的71%,AI将对海洋资源的深度开发起到至关重要的作用,但目前我们在海洋开发方面做得还不够,如利用AI去高效探测和开发海洋中的矿产资源。此外,任何一个拥有较长海岸线的国家都不希望看到“水下国门洞开”(underwater country gates open)。换言之,海防安全无疑是国家最重要的安全之一。

传统的海洋科技主要是从声学、磁学等层面来探测海洋资源,而AI对于海洋数据的深度挖掘和分析能力可以使传统的海洋科技变得更有生命力,从而实现对海洋资源的更高效的利用和保护。

光学作为获取信息的一种重要渠道,其在AI领域具有广泛的应用。然而。由于海水对光具有强吸收和散射作用,所以水下的光学世界一片混沌。如何提升水下远距离成像、水下光谱探测、水下多参数传感、水下激光通信等多个水下光学应用领域的数据质量成为了世界级难题。对于中国这样一个拥有面积广阔的内海和领海的国家而言,利用水下光学技术来观测水下的地貌、特征以及海水流动过程等信息,是关乎国防安全、资源管理和经济发展的一个重要课题。所以智能光学与AI对于海洋光学的发展是不可或缺的。

6. 分布式AI

当前我们在实施AI时遇到两大主要挑战:其一是大多数行业存在数据孤岛现象;其二是对隐私保护型AI的需求在日益增长。然而传统的使用集中数据的AI方法无法解决这些问题,联邦学习(federated learning, FL)是一种新的解决方案,它不仅可以解决数据孤岛问题,还可以实现跨数据、跨领域和跨企业的隐私保护型AI的应用[13,14]。

FL可以看作是一种基于分布式数据的具有隐私保护功能的协作式ML。它是一种具有以下特征的算法框架:

· 多个参与方共同构建ML模型。每个参与方都拥有一些训练数据,这些数据可以被用来在本地进行模型训练。

· 每个参与方所拥有的数据都不会脱离该参与方;只有模型参数或者梯度信息可以被分享。

· 根据安全方案,可以将模型(部分地)从一方转移到另一方[15,16],从而保证任何一方都不能通过逆向工程来获得其他方的数据。

· 经FL训练获得的ML模型的性能与使用集中数据构建的ML模型的性能非常接近。

依据各参与方数据的分布方式不同,我们将FL分为横向联邦学习(horizontal federated learning, HFL)、纵向联邦学习(vertical federated learning, VFL)和联邦迁移学习(federated transfer learning, FTL)。HFL适用于参与方有相同的数据特征而数据样本重叠较少的情况 [13,14]。它类似于数据表格视图中数据被横向切分的情况。VFL适用于参与方有较多重叠的数据样本而数据特征不同的情况[13]。它类似于数据表格视图中数据被垂直切分的情况。FTL适用于参与方的数据样本和特征都有较少重叠的情况,包括基于样本迁移的FTL、基于特征迁移的FTL和基于模型迁移的FTL [13,15]。

为了促进FL的发展,微众银行(WeBank)的AI研究人员开发了联邦AI技术使能者(Federated AI Technolo -gy Enabler, FATE)框架。FATE是一个开源项目,它是一个支持HFL、VFL和FTL的工业级FL平台。在满足数据保护前提下,我们可以使用FL来构建ML模型。FL在金融、医疗、教育、智慧城市和边缘计算等领域有潜在的应用前景[13,17]。例如,我们可以使用FL在银行、社交网络公司和电子商务公司内部进行本地模型训练,而无需共享三方的数据,然后我们可以通过安全聚合技术将三方本地训练的模型进行聚合,从而获得联邦模型以实现更好的推荐系统。

7. 结论

AI是一个多学科交叉的领域,其在科学、工业和社会等领域都有潜在的应用价值[18-21]。我们相信,AI的下一步突破应该颇具多学科交叉内禀。

猜你喜欢
参与方材料模型
基于秘密分享的高效隐私保护四方机器学习方案
适用于BDS-3 PPP的随机模型
土木工程材料的认识和应用
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
新材料赢得新未来
最美材料人
绿色农房建设伙伴关系模式初探
材料
涉及多参与方的系统及方法权利要求的撰写