张伟娜,黄 蕾,张 箴
(工业和信息化部中小企业发展促进中心 数据智能研究部,北京 100082)
目前,以人工智能、区块链、大数据、云计算等为代表的新一代信息技术正在成为推动中国数字经济发展的新动能。人工智能作为新一轮产业革命的重要引擎,是推动实体经济发展的重要驱动力,其开放创新已经上升到国家战略。区块链自2016 年首次被列入《“十三五”国家信息化规划》以来,其技术发展持续推动产业创新,并不断提高区块链新兴领域产业优势。可见,区块链和人工智能是两种技术趋势,并具有各自的显著特征及开拓性,且其发展侧重点各有不同:区块链的重心在于保持记录、认证和执行的准确,而人工智能则助力于决策、评估和理解某些模式和数据集,最终产生自主交互[1]。一方面,两者具有的主要共同特点和需求,将是其融合发展的关键;另一方面,两者都有助于提高对方的能力,同时也提供了更好的监督和问责的机会,如果将两种技术融合使用,可能是对整个技术(甚至人类)的重新定义。
数据、算力、算法是人工智能的三大核心要素,大量数据为机器学习提供模型训练的“原料”,多来源、实时、大量、多类型的数据是保障人工智能训练出高质量模型的基础支撑;算力是实现人工智能大规模计算的“助推器”,集群等计算力的提速是助推人工智能训练和推理效率提升的重要基础设施;算法是实现人工智能的“动力”,算法的迭代是从技术层面的创新到思维方式的转变,意味着人工智能乃至社会生态的无限可能。因此,数据、算力和算法被称为人工智能的“三驾马车”。当前,随着人工智能平台的落地应用,人工智能技术已在很多行业领域开始有所应用。
从本质上讲,区块链技术是一个共享数据库,存储于其中的数据或信息,具有“去中心化”、“可追溯”、“不可伪造”等特征[2]。区块链技术利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据,是一种全新的分布式基础架构与计算范式[3]。区块链的核心关键技术包括共识机制、网络协议、加密算法、隐私保护、智能合约等。
区块链技术最初应用在金融行业,作为底层技术与基础架构应用于比特币。当前,其巨大的应用价值已经从金融行业向交通、医疗、传媒等其他行业扩展和延伸。
人工智能以数据为基础,而区块链本质上是一种数据存储方式,或者叫“超级账本”,体现了数据智能[4]。因此,两种均与数据息息相关的技术可进行有效结合,互相取长补短,实现技术提升。
区块链技术具有分布式、公开透明、可追溯、难以篡改等特征,同时结合数据分布式存储、点对点传输、共识机制、加密算法等多种技术,能够提升人工智能使用数据的真实性、关联性和有效性,从数据、算力和算法三个层面,提升人工智能技术水平,创新人工智能的协作模式和计算范式,构建人工智能新生态。
人工智能以其智能化、自动化的特点,通过AI 算法的优化以及模拟,可以促进区块链的自然进化、数据整理,并且有效地防止区块链节点分叉的出现,能够更加有效地处理好区块链的运转,智能化提高效率。例如,人工智能可将传统智能合约改造为智慧合约,有效解决智能合约存在的安全性、易用性、可靠性等问题。同时,人工智能引入的“联合学习”等去中心化的学习系统,可用来解决区块链上信息量冗余的问题,能够提升区块链延展性,提高系统效率。
当前,人工智能产业中的海量数据缺乏统一高效的共享机制及管理方式,开源数据集维护性较差导致数据质量参差不齐,数据存在不集中、不统一等问题。此外,人工智能训练所需的大量数据主要集中在政府和大公司内部[5],监管及商业门槛等条件制约导致数据流通性差、获取困难,严重制约了中小企业发展人工智能的步伐。此外,在智能个体做出决策时,需要获取尽可能多的实时数据作为参考,如果没有足够的实时数据或者数据不够实时,那么这种人工智能也只能是有限智能。
区块链分布式数据库将各个节点进行高效数据共享,使得该网络上的每个参与者都可以访问数据,可为人工智能提供更广泛的数据访问以及更有效的数据货币化机制。首先,依托区块链技术可搭建去中心化的数据共享平台,该平台是基于区块链网络信息数据沟通平台,它的更新和信息记录由分布式主体共同交互完成,并非由某个权威机构执行[6];其次,区块链数据验证将促进更干净、更有组织的个人数据的建立,进而提供更加顺畅的数据集成,形成新的数据市场;最后,更多可供分析的开放、共享、实时数据将使机器做出的预测和评估更加准确,生成更加可靠的算法模型,进而提升整个人工智能的技术水平。
算力成本是当前人工智能行业的一大痛点。随着网络数据几何倍数增长以及算法模型复杂度和精度的提升,人工智能已达千亿参数、万亿的训练数据集规模,这无疑需要更大更强的运算量。普通人工智能科技公司需要百万元以上的资金购置GPU 等硬件资源建设计算中心,这对大部分中小型企业来说成本极高,导致“算力不充足、成本昂贵、难获取”的现状普遍存在。在OpenAI 发布的一份关于AI 计算能力增长趋势的分析报告[7]中称,自2012 年以来,创建最先进系统所需的计算量每年增加10 倍,算力已成为人工智能发展需要从成本效益等方面考虑的一大瓶颈。
区块链分布式计算能够将大型GPU 或FPGA 服务器集群、中小型企业闲散的空闲GPU 以及个人闲置GPU作为计算节点,共享计算资源,为人工智能提供算力供给。例如,在迅雷的区块链技术中,用户通过迅雷玩客云设备,可以分享带宽、存储和计算能力等闲置资源[8],虽然每个设备的算力很小,但当设备数量达到一定基数时,累计算力也是巨大的。
此外,如果能将专门为区块链挖矿机器设计的专用型集成电路芯片ASIC 算力的一部分提供给人工智能,在POW 共识机制中引入对人工智能ASIC 芯片友好支持的矩阵运算和卷积运算,可在使用ASIC 芯片挖矿的同时进行人工智能的分布式加速计算[9]。或者采用对人工智能ASIC 芯片友好型POW 算法,使得矿机在闲置或被淘汰后,可被用于AI 加速[10]。例如初创公司钛星区块链拥有的为算力而生的矿机,在比特币暴跌而惨遭遗弃后,经处理后继续为AI 运算提供算力支持[11],为未来AI矿机的面世提供了可能。
当前,人工智能市场需求较大,但在算法层面,无论在技术方向还是专业领域上,人工智能算法研发门槛及对人才队伍的要求都较高,当下算法仅能满足少数企业的需求,而对多数企业来说,开发个性化的产品具有很高的技术壁垒和资金壁垒,对于小企业独立开发的难度极大。此外,多数企业基于开源社区获取的开源软件算法,在实际使用过程中却有诸多规则或有版本适配等问题,严重限制了应用开发的灵活度和创新性。在基于开源社区进行代码托管或进行贡献时,管理自有知识产权代码不当会造成产权泄漏的风险。
利用区块链分布式协作的特性,可搭建发布机器学习任务的平台,利用群体智慧优化人工智能算法,并由多个人工智能专家更新维护,实现算法共享。此外,基于区块链技术可构建算法交易市场,允许用户在平台上发布任务、购买算法模型,在保证知识产权和隐私的条件下激励开发者并大大降低AI 使用门槛。
区块链挖矿需要大量的算力资源和电力资源。目前比特币每年消耗电量约25.5 亿瓦,几乎和一些小国家的全年耗电量一样。将人工智能用于POW 共识机制和哈希运算,可大大提高计算效率,从而节省电力和能源。例如新创企业Matrix,利用AI 将POW 与POS 结合使用,采用分层的共识机制,首先利用随机聚类算法在整个节点网络中产生多个小型集群并主要基于POS 机制选举出代表节点,再由选举出的代表节点进行POW 竞争记账权,相比全节点的竞争记账方式,可大大减少能源的浪费。另一方面,智能系统能够计算出特定节点优先执行任务的概率,从而提醒矿工找寻其他路径并降低总运算成本。此外,人工智能在优化能源消耗上的技术也可以应用在区块链上,进而减少采矿硬件的投资。
与任何其他编程语言一样,智能合约存在漏洞被黑客利用的安全性问题,且其去人为干预的特性使得漏洞无法线上修复,从而会引发更严重问题或连锁反应[12],犯错代价巨大,如The DAO 攻击事件、以太坊Parity 钱包攻击事件、美链BEC 攻击事件等[13]。另一方面,智能合约的不可篡改性及升级特殊性,使其实际上仅是基于不同输入而反馈的一系列确定性的复杂结果,在实际应用中缺乏灵活性,因此,当前的智能合约并不智能,易用性差。
安全性方面,在智能合约形成中,采用基于人工智能辅助的形式验证技术及动态约束检查的方法,能够在代码编写时主动挖掘代码与合约的漏洞,对智能合约的安全性进行自动化检查[14]。此外,人工智能生成对抗网络(GAN)具备博弈的特性,在智能合约中引入GANk 可生成对话网络形式,在合约生效前不断进行自我攻防测试来发现合约代码是否存在漏洞,极大程度上提高智能合约的安全性。
易用性方面,通过引入人工智能引擎,在图形界面和交互引导下,普通用户便可通过自然语言(如中文)输入交易目的及交易条件,由AI 把人类的自然语言转换成对应的脚本语言来编写智能合约程序,自动生成可用的智能合约。同时,通过AI 对更多合约样本的深度学习,实现对更复杂合约的处理。如全球首个基于智能合约的AI 对话服务平台Jarvis Plus[15],其初衷便是让每个人可以用自然语言来使用区块链和智能合约。
由于区块链的加密特性,在计算机上使用区块链数据进行操作需要大量的计算机处理能力(如比特币挖矿),即使执行最基本的任务所需的计算处理量也相当大。同时,为保证安全和去中心化,目前的区块链技术很难实现性能、安全和去中心化同时兼得,共识机制的执行导致了当前区块链系统运行性能低、能耗高等缺点。
机器学习系统也可以实时记录区块链正在发生的事情,可以在存储的数据类型及在特定的服务器上识别异常操作和模式,并在某个事件可能发生时提醒用户。此外,人工智能可以引入新的分散式学习系统来解决区块链上的数据冗余问题,扩展系统。分散式的学习系统,如联邦学习、新的数据分片技术等,可以使系统运行更加有效。
凭借人工智能算法的优化,结合POW 和POS 的共识机制,可节省区块链的电力及能源的消耗,并通过提高计算能力更好地提高区块链运行效率。此外,实践证明,通过AI 模型和算法的优化,还可实现区块链的自然进化、动态调整,可有效地防止分叉的出现。因此,利用人工智能技术可以优化区块链的运行方式,以更聪明、更周到的方式管理区块链运行任务,更加有效地管理好区块链的自治组织,让区块链更安全、更可靠、更高效。
面对人工智能和区块链领域的现存问题,两大技术的融合能够实现取长补短,当前已有部分应用案例将两者融合在一起。值得一提的是,无论是从当前区块链的技术指标,还是从大数据、人工智能的实际落地性来讲,真正实现技术融合并落地实施仍需要面对诸多不确定性因素,其融合的潜在性结果也难以评估,因此在积极研究AI 与区块链技术融合的同时也要理性看待、注重实践落地,有机结合、灵活创新,真正实现人工智能和区块链技术融合的实践和探索。