袁勇,欧阳丽炜,王晓,王飞跃
1.中国人民大学,数学学院,北京 100872
2.中国人民大学,金融计算与数字工程教育部工程研究中心,北京 100872 3.中国科学院自动化研究所,复杂系统管理与控制国家重点实验室,北京 100190
区块链是新一代信息技术的典型代表,是我国科技自主创新的重要突破口。2019年10月,中央政治局第十八次集体学习聚焦区块链技术,强调我国区块链技术应“走在理论最前沿、占据创新制高点、取得产业新优势”。国际上如IBM、摩根大通、微软,国内如百度、腾讯、阿里巴巴、京东等领军企业都相继布局和大力发展区块链技术。显然,区块链已经成为迫切需要技术攻关的前沿方向[1]。
然而,就应用现状而言,区块链的真正落地尚面临着诸多问题和挑战,其中业界广泛关注性能、去中心化治理和安全性三方面的问题。首先,主流区块链(特别是公有链系统)存在明显的性能缺陷,主要体现在挖矿过程、交易打包和区块广播等过程的高延时性,区块大小限制下交易的低通量性,以及挖矿过程的大量算力需求所导致的高能耗;其次是由于去中心化导致的可控治理困难,主要体现在去中心化区块链系统中存在的多种共识机制无法自适应调度,区块链实体层面的策略性行为可能会威胁区块链系统的去中心化治理,以及智能合约因缺乏智能性而导致的区块链实际应用受限;最后是安全风险高,目前区块链系统面临着多种安全攻击,严重缺乏有效的系统级安全评估手段、风险预警技术和决策支持能力,以及灾后修复技术。
这三个问题在深层机理层面相互制约、彼此限制,被业界统称为区块链领域的“不可能三角”问题(即难以实现“性能—去中心化治理—安全”的联合优化),一定程度上制约了区块链技术的应用拓展,成为区块链发展亟需解决的“卡脖子”问题。虽然目前区块链已在金融、能源、数字货币等领域取得了一定的应用进展,然而以上技术缺陷已俨然成为阻碍区块链技术实现更大规模应用的瓶颈,难以用传统的技术方法来解决。因此,亟需将新一代人工智能技术引入区块链系统的治理过程,从整体层面对区块链的性能、去中心化治理和安全实现多目标协同优化,同时探索和拓展该多目标优化问题的帕累托边界,辅助解决区块链在实际应用中面临的各种困境和难题。
新一代人工智能具有强大的数据解析、算法学习和决策推理能力,将其引入区块链系统有望为解决上述问题提供重要的理论支撑和技术保障。然而,理论研究方面,该领域研究尚处于起步阶段,现有研究相对匮乏,亟需针对区块链+ 人工智能的体系架构、基础理论和关键技术等方面的系统性创新研究。应用实践方面,国内外已经零星出现若干创业项目,均获得产业界的极大关注;然而这些项目均处于应用探索初期,亟需基础理论和方法的指导和支持。综上,如何利用人工智能为现阶段的区块链赋予智能特性,目前还未有显著研究进展和具体措施。因此,本文致力于提出区块链与人工智能相结合的新思路,试图将目前相对中心化的人工智能算法嵌入到去中心化的区块链系统,使得二者共融、增强,从而构建高效能、高可控、高安全、具有智能决策能力的新型区块链系统,形成“区块链智能”。
具体来说,本文将创新性地提出区块链赋能的“智能组件”概念与方法体系,其基本思路是采集和解析外生环境数据和区块链内生数据,通过人工智能算法实现深度解析和理解,规约成针对特定业务场景的领域知识,并将产生的知识和规则封装固化到智能合约中,形成不依赖第三方、自主和自治执行的智能组件;在此基础上,通过对面向不同任务和场景的智能组件进行灵活配置与计算实验,针对各种兼具不确定性、多样性和复杂性的场景和需求,自适应地产生和执行灵捷、聚焦和收敛的智能决策。这种区块链赋能的智能组件思路不仅有助于区块链系统性能、去中心化治理和安全等方面的联合优化,解决区块链系统面临的“不可能三角”问题,同时有望为分布式人工智能研究提供新范式和新思路。
本文组织结构如下:第1 节概述区块链和智能合约的背景知识与现状;第2 节提出智能组件的基本概念、学术思路和研究内容;第3 节探讨基于智能组件的分布式人工智能研究范式;第4 节总结智能组件研究中的关键问题和挑战;第5 节给出智能组件的初步应用案例;第6 节总结全文。
区块链技术起源于2008年由化名为“中本聪”(Satoshi Nakamoto)的学者发表的奠基性论文《比特币:一种点对点的电子现金系统》,是一种将数据区块按照时间顺序组合成的链式结构,是去中心化系统中由各节点共享和共同维护的分布式数据账本。具体来说,分布式的区块链节点(矿工)由点对点(Peer to Peer,P2P)组网方式相互连通和交互,在经济激励机制驱动下贡献自身算力,根据数据验证机制及传播协议,验证、传播并存储一段时间内生成的有效交易数据;同时,区块链利用默克尔(Merkle)树、哈希算法、时间戳和密码学技术来生成数据区块,依据特定共识算法争取记账权,最终获得记账权的节点将其生成的数据区块连接到主链上并获得相应的经济激励,其余节点更新区块链账本。总体来说,区块链是一种基于众多现有技术的新兴技术组合,其核心要素共识机制、加密算法、激励机制的选择将直接决定区块链的运行机制和性能[2-4]。
智能合约的概念最早于1994年由美国计算机科学家尼克·萨博(Nick Szabo)提出并定义为“一套以数字形式指定的承诺,包括合约参与方可以在上面执行这些承诺的协议”。区块链上的智能合约可看作运行在分布式账本上的、预置规则、具有状态、条件响应的,可封装、验证、执行分布式节点复杂行为,完成信息交换、价值转移和资产管理的计算机程序。基于区块链的分布式架构和共识机制等,智能合约允许互不信任的用户在不需要任何第三方可信中介或权威机构的情况下完成交易和价值的点对点直接交换。同时,数字形式的智能合约可灵活地嵌入各种有形或无形的资产、交易和数据中,实现主动或被动的资产、信息管理与控制。
智能合约的生命周期根据其运行机制可概括为协商、开发、部署、运维、学习和自毁六个阶段。智能合约的基础架构如图1 所示,模型自底向上由基础设施层、合约层、运维层、智能层、表现层和应用层组成[5-6]。智能合约极大地拓展了区块链的应用场景,使其不再局限于数字货币,而是有机会构建更为宏观的金融系统并应用到其它社会领域。
以太坊是世界上首个内置图灵完备编程语言并正式引入智能合约概念的公有区块链,是目前最流行、生态最完善、扩展最丰富的智能合约开发平台[7]。利用可执行任意复杂算法编码的以太坊虚拟机,用户可以按照自身意愿在以太坊平台上高效开发出多种智能合约以及建立在智能合约上的各类去中心化应用(Decentralized Applications,DApp)。除以太坊外,其它主流智能合约开发平台还包括 Hyperledger、EOS、NEO、Qtum 等。
图1 智能合约的分层模型Fig.1 The layered model of smart contracts
如果说区块链是具有普适性的去中心化技术架构,那么智能合约就相当于区块链的应用接口,帮助区块链的分布式架构植入不同场景。通过将核心的法律条文、商业逻辑和意向协定存储在智能合约中,可产生各种DApp,并逐步演化为去中心 化自治组织(Decentralized Autonomous Organization,DAO)和去中心化自治企业(Decentralized Autonomous Corporations,DAC),进而集成和涌现为去中心化自治社会(Decentralized Autonomous Society,DAS)。这些表现形式有望改进传统的商业模式和社会生产关系,为可编程社会奠定基础[8-10]。
然而,作为一种新兴技术,智能合约仍存在诸多制约其发展的关键问题亟待优化和解决,例如安全问题、性能问题、隐私问题、法律问题等。针对这些问题,学界和工业界相继提出了一些初步解决方案。例如,针对智能合约安全问题,Luu 提出一种符号化执行工具Oyente,用以检测以太坊智能合约中交易顺序依赖、时间戳依赖、可重入性、异常处理等潜在漏洞[11]。针对性能问题,Dickerson 提出一种智能合约并行执行框架,允许独立非冲突的合约同时运行,从而提高系统吞吐量,改善合约执行效能[12]。针对隐私问题,Kosba 提出一种旨在保护用户隐私的智能合约开发框架Hawk[13]。总体来说,这些工具和方法大多停留在实验阶段,尚未在实际系统中取得大规模应用。
实际上,从发展角度来讲,智能合约面临的关键问题是缺乏智能性。当前的智能合约本质上是一系列的“If-Then”式情景—应对型规则,并不具备真正意义上面向动态和开放场景的智能性、自主性和适应性,只能按照静态的、预定义的规则被动执行。真正意义上的智能合约应当类似于人工智能研究中的智能体(Agent),不仅单个智能体具备自主和自治的感知、学习和推理功能,智能体与智能体之间还应具备交流、竞争与协作能力。已有一些学者尝试在智能合约中编码智能算法[14],但由于现阶段区块链网络为保证分布式一致性暂未纳入浮点数等复杂计算,以及以太坊等平台为激励全球算力的投入和合理分配使用权、避免系统因恶意程序走向失控而对程序执行所耗计算资源收费等因素,智能合约可编码算法的复杂度和求解精度都十分有限,而且容易导致高昂花费。随着以太坊等平台的进一步升级和程序执行费用下调,智能合约可望纳入更多复杂算法。
本节将提出智能组件的基本概念,探讨智能组件的学术思路,并给出智能组件的研究内容和实现途径。
智能组件是一个新概念,最早由西安交通大学郑南宁院士于2018年科技部“科技创新2030—新一代人工智能重大专项”项目组的一次研讨会中提出。本文试图基于区块链和智能合约技术重新定义并给出实现智能组件的一种可行思路,这种思路在一定程度上受陆汝钤院士早年提出的“知件”概念启发[15]。
基于区块链的智能组件是一种融合人工智能算法的、可插拔的、去中心化自主执行的区块链系统核心功能模块。智能组件以运行于区块链上的智能合约为主要载体和表现形式,通过将人工智能技术优化后的算法、机制、策略等要素内嵌到智能合约中,由区块链系统所有参与者验证且分布式存储,即可形成针对特定业务场景和目标任务的标准化、规范化的智能组件。因此,智能合约发展的高级形式就是一系列不依赖第三方、自主自治的通用或专用智能组件,通过针对特定场景和计算任务自动选择和配置最优组件组合,就可以实现自适应学习与优化的智能区块链系统。
具体来说,一个区块链系统是由若干核心要素(数据结构、通信网络、共识算法、激励机制、加密算法等)构成的,不同的应用场景对区块链效能、去中心化程度和安全性的要求不同,不存在单一或者一劳永逸的要素配置方案。因此,有必要将区块链各核心要素以智能组件的方式封装起来,形成可插拔和灵捷适配的智能组件库。一方面,可以充分发挥运行于区块链上的智能组件在安全透明、激励驱动和去中心化方面的优势;另一方面,通过将深度学习、对抗学习和强化学习等新型人工智能算法融入到智能组件中,可以构建出高效能、甚至具备类人决策与判断能力的新型区块链系统。
智能组件将是分布式人工智能研究的新范式,是从早期面向对象的研究范式向面向智能体的研究范式演进过程中必须经历的过渡阶段。
复杂系统研究中,还原论与整体论之争由来已久。前者认为复杂系统可以通过各个组成部分的行为及其相互作用来加以解释,因而试图通过分治法,将复杂的系统、事务和现象层层分解为各个简单的组成部分来加以研究;后者则认为将复杂系统还原分解为简单系统来孤立地加以分析是行不通的,因而提出视复杂系统为不可分割的整体,通过研究系统的输入和输出来理解高层的系统行为[16]。近年来,随着互联网和人工智能技术的发展,复杂系统的尺度、规模、数量等都已经呈现出前所未有的快速增长趋势,单纯地还原论或者整体论已经难以应对。因此,研究者们开始探索基于整体论与还原论相结合的新研究范式,例如王飞跃研究员提出的平行智能理论和ACP 方法(Artificial Societies + Computational Experiments + Parallel Executions,人工社会+计算实验+平行执行)就是“整体与还原相结合、定性与定量相结合、实际与人工相结合”的原创方法论[17-20]。
图2 智能组件的研究思路Fig.2 Research idea of intelligent-ware
区块链系统已呈现出前所未有的复杂性、动态性、强耦合性和不可预测性。基于机理分析的传统方法难以定量、实时地对其行为、机制、策略、结构等要素进行建模、分析和评估。其直接后果就是,现有的区块链研究通常会陷入“还原分析”误区,即在假设其它要素不受影响的前提下,孤立地分析和优化特定的区块链组件和特性。以不可能三角问题为例,目前主流研究方法大多数都是在固定去中心化程度和安全性两个参数的基础上,孤立地通过高通量共识或者低耗能共识来优化区块链系统的性能。实际上,区块链各要素通常是相互制约和影响,“牵一发而动全身”,因而往往使得这种基于还原分析的解决方案失效[21-23]。
基于这样的基本判断,本文提出的智能组件概念有望将整体论和还原论融合起来,且兼具还原论的精确性和可解释性,以及整体论的简约性和有效性,是一种自底向上的研究范式,因而特别适合解决区块链和分布式人工智能这类复杂系统中由于微观行为、机制、策略和市场结构等要素的耦合互作用而在宏观系统层面涌现出的新型实践问题。
基于智能组件研究区块链系统的基本思路如图2 所示:就现状而言,智能合约本质上大多都是静态的情景—响应规则和知识。因此,需要将新一代人工智能的新算法、新机制、新策略等封装到智能合约之中,形成可以动态配置的智能组件。这些智能组件就是针对特定业务的标准“能力库”,是“智能乐高”。在实际应用过程中,面向多样化的业务场景和任务需求,可以将场景和任务所需的能力进行分解,选择和调度使用合适的智能组件,进而通过最优化评估和筛选,实现智能组件的灵捷配置,“组装为”针对该场景和任务的智能Agent;在此基础上,通过大规模Agent 的竞争、合作与市场交互,即可实现特定的DAO。这种思路的优势是可以将人工智能和区块链深度结合,将“智能”真正地嵌入到智能合约中,实现从Smart Contract 到Smart Contractor的飞跃。
智能组件是区块链和人工智能研究的“合一体”。通过设计和评估基于区块链和智能合约的智能组件,一方面可以把人工智能的数据解析、知识推理和智能决策能力引入区块链系统,提升区块链系统的自适应学习与优化能力;另一方面也可以反过来利用区块链和智能合约技术解决人工智能算法的分布式协作和可信共享问题,为实现分布式人工智能奠定基础。具体研究内容和方案如下。
2.3.1 智能组件的设计与实现
现阶段,智能组件的理论研究和实践尚处于起步阶段,缺乏明确的理论与方法体系和有效的评估手段。因此,首先需要研究智能组件的概念、架构与技术路线。
本节简要介绍两种智能组件设计思路。
(1)封装区块链底层算法、机制和协议的智能组件设计思路。
目前,主流区块链系统中的核心组件(如共识机制、加密算法、激励机制等),均是在系统建立之初就人为设定的,一旦上链运行便无法更改。如何面向特定的计算任务和应用场景,设计可插拔的区块链智能组件,从而实现针对特定任务需求自动选择和配置最优的智能组件组合,是区块链技术迈向成熟的一个关键问题。
本设计思路的重点是通过抽取和规约区块链领域知识,实现区块链底层算法、机制和协议的自主学习、引导与决策,形成区块链领域知识库。基于知识库设计一系列模块化、可插拔的区块链底层算法、机制和协议,例如共识算法、数据传播协议、激励机制、挖矿策略和数据资产估值模型等。进而,以智能合约的形式来设计、转化、封装、构建相应的智能组件,并形成功能丰富、接口标准、不可篡改的动态或静态智能组件库,以便后续智能组件的筛选和组合。这种设计的关键难点在于智能合约计算能力有限,不支持复杂运算,不支持随机性,协议中复杂数学模型需要转化和简化实现并最小化转化和简化误差。潜在解决方案包括:以太坊等智能合约平台正在升级,随着平台本身功能的扩展和运行费用的下调,智能合约的计算能力会有提升;分布式计算领域的数据舍入保持一致性算法可以为智能合约中数据的舍入提供参考;复杂的数学模型有望转化和简化,如指数函数可以转化为多项式函数,前馈神经网络可以转化为多项式拟合,AdderNet 等加法神经网络有望转化为智能合约形式,预言机可提供一定随机性等[24-27]。
(2)联合人工智能算法实现智能性的智能组件设计思路。
现阶段区块链吞吐量等性能有限,智能合约受计算能力限制无法实现复杂算法,不具备智能性,因而越来越多的区块链项目方案建议将合约计算与高耗能共识拆分,如前述的Layer 2 方案等。因此,直接将复杂人工智能算法转码并封装成智能组件形式上链计算的思路虽然可行但可能低效。潜在解决方案为:利用可信环境下执行的人工智能算法作为智能合约智能性的补充,即通过可信硬件计算、同态加密算法等密码学方式在链下可信环境中计算人工智能算法,利用智能组件协调和控制可信智能算法间协作交互关系,最终共同应对复杂任务。在此过程中,计算任务仍然交由善于计算的人工智能算法在链下完成,协作任务交由智能组件实现对算法的认证、担保、溯源、评估和融合。智能合约没有直接具备“What-If”包含随机性的编码能力,但智能组件+人工智能整体却获得了应对未知场景下“What-If”式智能推演、计算实验和自主决策能力。在这种思路下,区块链也获得了一定的智能,而人工智能的联邦学习、边缘计算架构更是可以直接植入区块链。
2.3.2 智能组件的评估、 筛选和组合
智能组件设计与实现之后,必然需要一套针对特定业务场景和任务目标的评估、筛选与组合方案。现阶段,区块链和智能合约的评估方案尚不完善,区块链系统通常用吞吐量作为性能指标进行评估,智能合约则通常用消耗计算资源的大小作为性能指标进行评估。这些单一维度、不完备的指标无法全方位地评估兼具工程复杂性和社会复杂性的区块链系统,更无法适用于智能组件评估。
因此,需要根据所实现的智能组件功能特性,设计一套专用的量化评估指标作为后续组件组合和筛选的参考。例如,对于封装了共识算法的智能组件来说,可能的量化评估指标就包括经济学能耗、出块速度、最大可容纳恶意节点数、去中心化程度评级等。这些数字化指标可作为智能组件的性能说明参数,作为自动化或智能化筛选组合算法的依据。智能组件筛选和融合算法实现的基础是,复杂计算任务的量化、分解、分配及智能组件性能参数量化。在这些量化数据的基础上,智能组件筛选和融合算法可转化为在有限个可行解的集合中找出最优解的一类组合优化问题。组合优化问题是运筹学中最优化问题的一个重要分支,已有坚实的理论和算法基础,遗传算法、启发式算法和基于神经网络、深度学习的优化算法都可以应用于智能组件的筛选和组合。
现阶段,大多数人工智能算法和技术是在少数高性能计算单元上,通过在有限时间内处理海量数据产生针对特定场景的智能,因而是相对中心化的单体智能形态,并且在不确定性、脆弱性、动态开放条件下存在较大的决策风险,以及人机协作不畅等问题。同时,普遍存在的中心化数据集难以满足安全和隐私保护需求,而且中心化算法模型需要强大的算力支持。因此,可适用于大规模复杂系统动态管理与智能控制的分布式人工智能成为近年来的研究热点与发展趋势。
分布式人工智能是人工智能的重要分支,起源于20 世纪70年代末,其基本思路是利用分布式架构来克服单体智能系统的资源受限性、时空分布性、功能互补性等限制并获得分布式系统所具备的并行性、容错性和开放性。分布式人工智能最早期的研究对象是自然界普遍存在的分布式智能组织, 例如鸟群、鱼群、蜂群和蚁群等。例如,单个的切叶蚁的行为是非常简单和机械的,而大规模切叶蚁群体通过竞争与合作则可以体现出极高的智能行为。互联网出现之后,分布式智能的体现方式演进为人肉搜索、网络众包等大规模自发的网络组织,即动态网民群体(Cyber-enabled Movement Organization,CMO)。本质上讲,CMO 实际上是互联网形态下DAO 的雏形,因而区块链技术出现以后,CMO 自然地演变为DAO,使得分布式智能形态跨越了新的台阶。
与CMO 相比,DAO 可以通过加密货币和首次代币发行(Initial Coin Offering,ICO)机制实现群体行为的激励,可以借助区块链技术保障安全和隐私并在面临安全攻击时提供必要的预警防御,同时也可以借助智能合约实现全流程的自动化。因此,DAO 将是区块链时代的分布式人工智能的主要形式,是建模区块链生态系统的一种非常好的方式。区块链天然的分布式架构和可编程智能合约可作为分布式人工智能系统的底层计算框架。
区块链和人工智能的结合为分布式人工智能奠定了技术基础,数据与模型的分布式特性以及隐私保护的必然需求为分布式人工智能奠定了应用基础,而区块链赋能的智能组件则为分布式人工智能提供了新型研究范式。就现状而言,分布式人工智能的主要研究方法论包括20 世纪70年代自顶向下的分布式问题求解和90年代成为热点的自底向上的多智能体系统(Multi-Agent Systems,MAS)。基于智能组件研究范式,研究者既可以采用分布式问题求解的思路,先自顶向下地分解任务再评估、筛选和指派最优适配的智能组件,也可以采用多智能体系统的思路,先定义智能组件再通过组件之间的竞争与协作、自底向上地完成一个或多个子任务。例如,如果以MAS 思路实现智能组件的协作,则在其经典的合同网任务分派协议中,智能体将被动态分配管理者或合同者两种角色,管理者负责分解任务并发送给潜在合同者,合同者竞标完成任务从而实现动态任务分配。这个过程中的管理者、合同者、竞标合约等可用智能组件的形式封装完成。
从研究角度来讲,目前智能组件相关研究在数据感知、解析建模、灵捷适配和智能决策四个角度都存在着亟待解决的关键问题与研究挑战。
首先,区块链是最具代表性的“人在环路中(Human in the Loop)”的智能系统之一。因此,基于区块链的智能组件研究必须兼顾区块链系统的社会复杂性和工程复杂性,深度融合社会—物理—信息三元空间(Cyber-Physical-Social Space,CPSS)的数据和知识。同时,由于跨链技术尚处于早期阶段,目前的区块链系统形成了相对孤立的“数据孤岛”或“价值孤岛”,单纯依靠闭源链上数据来实现数据到知识再到智能的转化极有可能会形成区块链封闭系统内部的循环和收敛,因而必须将开源情报技术与区块链的预言机(Oracle)相结合,实时采集链下数据和开源知识,并引入区块链的数据—知识转化与融合过程,实现更具“活”性的智能组件。由此可见,如何有效融合区块链系统的开源—闭源和链上—链下数据资源,实现信息交互与融合,并转化为指导区块链和智能组件的知识和决策是需要研究解决的首要问题。
其次,基于智能组件的区块链复杂系统建模是其进一步智能解析的基础。由于区块链系统横跨社会、物理和信息空间,如何定性与定量相结合地分析与评估区块链系统中人的行为与社会因素,实现区块链复杂系统的CPSS 跨域建模,是实现智能组件的现实需求。基于智能组件的建模必须将复杂系统的还原建模与整体建模相结合,前者注重矿工和矿池等区块链微观个体层面的特征刻画与行为交互,后者则强调宏观区块链生态系统层面的高层涌现与演变规律。一般说来,区块链(特别是公有链)系统通常包含大量的个体参与者,例如挖矿节点、交易节点、矿池等。这些参与者通过区块链网络相互连接,并遵循特定交互协议和共识算法共同维护和更新数据链条。因而,必须首先针对大量个体参与者节点进行微观层面的还原建模,全面、精准地刻画参与者的静态特征、动态行为及其交互机制。还原建模越精准、粒度越细,则后续整体建模的复杂度越高,但获得的高层涌现与演变规律更为准确可信。因此,智能组件必须兼顾还原建模粒度和整体建模复杂度,并寻求二者的最优均衡,实现“人在环路中”的CPSS 跨域建模。
第三,现阶段,智能合约是区块链系统中体现 “智能性”的重要组件,也是实现智能组件的主要载体和表现形式。然而,业界的共识是目前的智能合约仅是一组自动执行的“情景—应对”型规则,无法有效地实现区块链系统效能、可控、安全等方面智能决策。人工智能的算法优势与学习能力恰恰能够弥补区块链在这方面的缺陷,为区块链引入基于知识的判断与决策能力。主流区块链系统中的核心组件均是在系统建立之初就人为设定的,一旦上链运行便无法更改。如何面向特定的计算任务和应用场景,设计可插拔的区块链智能组件,从而实现针对特定任务需求自动选择和配置最优的组件组合,是区块链技术迈向成熟的一个关键科学问题。从多智能体分布式协同与决策的理论与方法出发,通过研究数据与知识引导的、基于智能合约的区块链智能组件构建方法与配置,并通过深度强化学习提升基于智能组件的智能体自主学习与协作能力,可以实现更加灵捷、高效、可扩展的区块链系统,针对各种兼具不定性、多样性和复杂性的场景和需求,自适应地产生和执行灵捷、聚焦和收敛的智能决策,这是智能组件研究亟待解决的又一关键问题。
最后,目前的区块链研究主要基于实际发生的历史数据样本,而缺乏针对各种未知情境的“虚样本”,特别是针对各种安全攻击的“负样本”,这使得区块链系统的适应性和创新能力都比较差,新思想和新技术很难直接应用于实际区块链系统,这也是目前许多比特币改进提议(Bitcoin Improvement Proposal,BIP)仍然处于提出和草案状态、无法真正激活和落地的主要原因之一。我们认为,利用平行智能理论方法来产生针对各类计算场景的、虚实结合的数据样本甚至是智能组件,通过实际与人工相结合的平行区块链协同演化、闭环反馈和双向引导,来实现对实际区块链系统的优化,促使整个平行区块链系统向设定或涌现的目标收敛,是解决该问题、使得区块链智能化的重要途径和手段。常态情况下,人工区块链通过大量虚拟产生的计算实验场景和智能组件来探索、封装各类新的模型、场景、机制和策略等,形成体系完备的“情境—应对”知识库或组件库;非常态情况下,平行区块链应具备自适应切换到与当前情境最优匹配的智能组件的能力,并通过数据、机制、策略和算法等要素在虚实区块链系统之间的实时同步,逐步引导实际区块链逼近最优化的人工区块链状态(而非反之)。因此,有必要研究平行智能、区块链和智能组件的结合应用,其难点在于如何利用数据与知识的闭环双向驱动机制,通过智能化的交互方式实现虚拟系统与实际系统的紧密结合、互动反馈与平行执行。
本节简要介绍两个初步应用案例,分别阐释第2.3.1 节提出的两种智能组件设计思路。具体说来,针对小规模人工智能算法和模型,可以直接封装到智能合约(去中心化知识图谱案例)[28-29];而针对需要复杂计算的人工智能算法和模型,则可在链下实现计算,由链上智能组件控制其分布式协作(人工智能学习市场案例)[30]。
知识图谱是人工智能研究的重要领域。2012年,Google 首次提出知识图谱的概念,旨在通过搜集真实世界中存在的众多实体的概念,以及这些实体、概念之间的关系,来改善搜索引擎的性能。凭借强大的语义处理和互联组织能力,知识图谱几年里已经在信息检索、自动问答、个性化推荐等领域获得了成功应用。
然而,传统的知识图谱构建过程普遍存在费时耗力、缺乏审计、易被恶意篡改/攻击、数据被中心化机构垄断等问题。因此,我们提出一种基于区块链和智能组件的去中心化知识图谱构建方法,通过链上众包过程汇集群体智慧,以分布式协作的方式共同构建和验证知识图谱,并通过链上智能合约实现众包业务逻辑,使得图谱构建过程去中心化、公开透明且无法篡改[28-29]。
生成知识图谱之后,进一步利用深度学习方法构建深度推荐系统,学习知识图谱间的映射规则,然后利用智能合约来封装这种推荐规则形成智能组件,就可以在链上以去中心化方式执行。这项工作的初步应用场景是企业管理中的任务推荐,即利用区块链构建员工技能知识图谱和任务知识图谱,通过深度学习方法获得知识图谱间的映射规则,并将映射规则封装到智能合约里,即可针对特定任务自动推荐合适的员工。这项工作具有良好的研究意义和应用前景,通过链上智能组件来自动分配任务,可以在某些生产型企业里取代某些中层领导岗位,让企业架构更扁平化,这也在一定程度上实现了企业的去中层化。
现阶段的人工智能技术通常采用高度依赖大规模集中数据和高性能计算资源的中心化架构。这种架构面临的数据孤岛问题和计算资源限制增加了人工智能技术深入应用的壁垒。因此,近年来,针对人工智能数据、模型和资源的分布式协作研究引起了广泛的兴趣。考虑到现有的基于信任的协作模式,如由中心化组织控制的任务众包及模型共享市场和采用半中心化架构的联邦学习等分布式计算架构已不再适用于开放动态环境下相互不信任机器间的大规模分布式协作,我们提出了一种基于智能组件的新型去中心化人工智能协作框架,称为学习市场(Learning Markets)。在该市场中,区块链为互不信任参与者的协作和交易提供了可信环境,智能合约则作为软件代理来封装和处理可扩展的协作关系和市场机制[30]。
具体地,学习市场由协作市场和共享市场两部分组成,包含组织者、验证者、训练者和矿工4 种角色,由权限管理、数据传输、模型验证、贡献评估、激励量化5 种智能组件实现主要功能。协作市场负责实现学习任务的外包和分布式参与者的协同挖掘,共享市场则负责收集协作市场中产生的已验证及评估模型形成可信模型库和可信智能组件库供后续定价和共享。基于该学习市场,相互不信任的参与者一方面可在动态量化贡献下实现分布式协同挖掘,另一方面,可在天然具有可审核性、可追溯性和货币化方法的人工智能市场中共享可信模型和数据。
案例实现方面,我们以计算资源有限的组织者发起MNIST 图像分类任务为例,通过智能组件控制的分布式协作获取具有高预测精度的集成模型。我们基于以太坊和星际文件系统(Inter-Planetary File Systems,IPFS)平台实现了学习市场,其中分布式节点基于训练集数据生成个体学习器,并根据验证节点在验证集上的验证结果采用联邦学习架构融合模型权重。实验表明,基于智能组件的加权融合集成模型在四个实验数据集上的精度为99.3%、99.2%、99.2%和99.2%,远高于平均融合集成模型的精度50.3%,79.4%,62.3%和54%[30]。实验结果显示,基于智能组件的加权融合集成模型更有利于公平地量化和融合协作者贡献,提高协作公平性、透明性、安全性、去中心化和通用性。
近年来,区块链和人工智能技术呈现出相互赋能、和谐共生、共融增强的发展趋势,并可望解决区块链领域面临的关键挑战,催生新技术、新模式和新业态。为促进该领域的研究,本文提出基于区块链的智能组件概念与方法体系。智能组件是融合人工智能算法的、可插拔的、自主自治的区块链系统核心功能模块,是构建未来智能区块链系统的基础组件和分布式人工智能的新研究范式。
智能组件将为目前的区块链和人工智能研究带来新思路。对于区块链来说,通过构建基于智能合约的智能组件,引入新一代人工智能算法实现面向特定计算任务和业务场景的智能组件筛选与融合,使智能合约具备应对未知场景下“What-If”式智能推演、计算实验和自主决策能力,将使得智能合约从目前仅具有静态规则执行能力的“自动化”合约转变为真正意义上的“智能化”合约。对于人工智能来说,结合集成学习、联邦学习、边缘计算等现有智能算法和计算架构,基于区块链的智能组件可以被用来构建分布式人工智能决策和协作平台,增强人工智能数据管理、存储和传输可靠性,激励计算信息共享和交易,提升机器决策可信度,促进实现人机协作下的混合增强智能。
利益冲突声明所有作者声明不存在利益冲突关系。