袁梦 宗洁琼 张正敏(上海市质量和标准化研究院,上海 200000)
标准化工作对人工智能产业发展具有基础性、支撑性、引领性的作用,既是推动产业创新发展的关键抓手,也是产业竞争的制高点。当前,我国人工智能相关产品和服务不断丰富的同时,也出现了标准化程度不足的问题[1]。一方面,人工智能涉及众多领域,现有标准化基础及工作较为分散,不足以支持整个领域;另一方面,人工智能属于新兴领域,发展方兴未艾,从世界范围看标准化工作仍在起步过程中,标准制修订相对滞后,尚未完成标准体系。另外,现有标准系统内部关联性及发展规律并不十分清晰。因此,迫切把握机遇,抢占标准创新制高点,加快对人工智能技术及产业发展的研究,首先需要系统梳理人工智能领域相关的标准,明确标准间的依存和制约关系,来推动和完善标准体系,以标准手段促进我国人工智能技术、产业蓬勃发展。
工业机器人是人工智能领域中发展较早的一支,我国工业机器人的研制虽然起步较晚,但凭借广大的市场潜力和众多的人才和资源基础,近年来迅猛发展。其中,从近几年推出的机器人产品来看,工业机器人技术正在向智能化、模块化和系统化的方向发展。随着工业机器人向更深更广方向的发展以及智能化水平的提高,其应用版图正在不断扩大,然相关标准体系不完善,标准制修订滞后,缺乏自主创新等问题,制约着工业机器人产业的提质升级。从标准层面来讲,与发达国家的学者和专家对智能制造装备的理解相比,我国尚处于起步阶段。基础共性标准、关键技术标准、产品标准和重点应用标准亟待研究制定,以提升自主技术标准的国际话语权。
十九大报告中强调要坚定实施创新驱动发展战略,网络科学[2]在相对较为成熟的行业领域,从标准及其规范性引用文件入手,已经开始了系统性探索。例如,标准间关联规则地探索[3],利用规范性引用关系[4],利用语义相似度等[5],将标准系统转化为网络模型,并在日化等行业领域逐步开展系统性的探索和实证研究,挖掘内在规律、定位关键标准[6-7]等。
本文以人工智能产业中工业机器人为研究领域,依托上海市质量和标准化研究院标准文献馆百万级的馆藏标准数据,结合产业链进行数据检索;对标准数据采集、梳理和预处理后得到基础数据集;然后,对它们的规范性引用文件进行梳理核查实施状态,删除已作废的标准,并根据当前的制修订情况进行数据调整,将符合条件的规范性引用文件中的标准扩充到基础标准集,作为本项目的标准数据集。
前期,研究小组结合标准间信息传递方向和规范性引用关系,在日化用品行业标准系统中制定了标准间的连边规则,即标准与其规范性引用文件之间存在连边,连边的方向遵循信息流动方向,由规范性引用文件指向引用它们的标准,并假设它们之间的信息流量完全相同,以此在标准集中搭建有向连边,而不存在规范性引用关系的标准件不存在连边,以此规则建立标准有向网络。然而,工业机器人行业相对日化行业起步较晚,发展尚未成熟,处于高速发展期,市场上广泛流通的标准数据量有限。因而,考虑到标准的连通性,标准间信息传递不具有衰减性,以及信息传递非间接性等问题,本项目研究的工业机器人相关标准及规范性引用转化的数学模型忽略信息流传播方向,建立无向标准网络。
工业机器人领域起步较晚,标准体系尚未成熟,本文从研究标准规范性引用系统的网络基本拓扑性质等问题入手,探索性地对发展相对不成熟的领域尝试梳理规范性引用关系,转化为复杂网络模型,探究该网络的基本拓扑性质,分析其生成机理。
如果一个网络中节点的度值都集中在某个值附近,那么该网络称为均匀网络;相反地,如果网络中节点的度值很不均等,既存在度相对较小的节点,也存在度非常大的节点,那么该网络被称为非均匀网络。
节点的连边数量记为该节点的度。将网络中节点的度按从小到大排序,统计得到度为k的节点占整个网络节点数的比例记为pk,意为网络中随机选择一个节点的度为k的概率,其分布情况即为该网络的度分布。
在各类分布中,幂律分布是唯一一种具有无标度特性[8]的长尾分布,且度分布服从幂律分布的网络称为幂律网络。当度分布服从幂律分布的网络,其幂指数从小变大时,被认为是从高度非均匀网络变化为高度均匀网络,一般认为只有幂指数较小(γ≤3)的才是非均匀网络[9-10]。
一个包含N个节点的网络的密度ρ定义为网络中实际存在的边数M与最大可能的边数之比,记为式(1)
实际网络的规模随时间而演化,其中节点和连边总体上呈现增加趋势,但网络是变得越稠密,还是越稀疏有待于实践认证。当N→∞时,密度趋向于非零常数,则表明网络中实际存在的边数与N2同阶,网络是稠密的;若N→∞时,密度趋近于0或者网络平均度趋近于一常数,则表明实际存在边数比N2低阶,网络是稀疏的。
如果一个网络具有短的平均路径长度和高的聚集系数,则该网络具有小世界特性[11]。
网络的平均路径长度L定义为任意2个节点之间的距离的平均值,如式(2)所示,即
聚集系数是指一个节点的2个直接邻居节点也具有连边的概率。网络中一个度为ki的节点i的聚集系数Ci,且网络聚集系数C定义为式(3)
其中,Ei是节点i的ki个邻居节点之间实际存在的边数。聚集系数的取值范围为[0,1],其中,当聚集系数为1时,该网络时全局耦合的,即网络中任意2个节点直接相连。
在发展较为成熟的日化用品行业领域,相关标准数量相对丰富,因而根据规范性引用关系的存在性和信息传播的流动性制定连边规则,建立了有向标准网络,并结合网络的基本拓扑结构性和节点的重要性等,发现标准被引用的频次、局部和全局影响力对它在系统中的重要性影响更为明显[5-7]。相比之下,工业机器人行业起步较晚、发展不成熟,相关标准数量较少,标准体系有待丰富,且标准间信息传递不具有明显衰减性。因此,仅依据标准间的规范性引用存在性,对工业机器人领域标准系统制定连边规则,建立标准网络。
馆藏系统中,工业机器人应用领域的标准200多份,在采集并梳理标准的规范性引用文件后,核查标准的使用状态,删除废止标准,标准与其规范性引用文件间存在连边,与其他标准无连边,以此为连接规则,忽略引用与被引用的方向性,并假设所用引用关系是等价的,转化为以标准为节点,规范性引用关系为连边,建立无权无向的标准引用网。
本项目研究小组为探索新兴高科技领域标准的发展趋势,建立工业机器人应用领域的标准引用复杂系统,转化为网络模型,得到一个规模G1(532,1080)的网络图,如图1(a)、(b)所示,其中最大的连通子图G2(475,1012),占据网络中89.29%的节点,93.7%的连边。孤立的碎片中,部分标准制定年限较早,部分被广泛应用却未在规范性引用文件中体现,也有面向专业应用领域的部分,有待于发掘与连通子图之间的关联性,完善标准数据。例如QJ 1352-1988《机器人产品型号命名方法》属于早期航天工业部批准发表的基础性标准,内容中包含多种机器人的命名方法,除工业机器人外还包含服务、航天、军用机器人等,但未能从形式上被多个标准规范性引用,尚不能体现它在基础性标准领域的重要性。
图1 标准网络及最大连通图
经初步统计分析,该网络中节点的度分布,经最小二乘直线拟合,网络图近似拟合为,最大连通子图近似拟合为的幂律分布,如图2(a)、(b)所示,分别为和且幂指数均小于3,且平均度密度和度分布、密度以及平均度等基本拓扑性质指标表明,该网络及最大连通子图各指标值近似,均为稀疏的,符合幂律分布的,非均匀网络。
图2 标准网络及最大连通子图的度分布
在许多实际的复杂网络中,节点数巨大,网络的平均路径长度小得惊人,即为小世界现象。网络的平均距离严格来说只有对连通图才是有限值,因此提取网络中的最大连通子图,利用广度优先算法,得出该网络的平均路径长度 ,表明连接该网络中任意2个节点,最短路径途中不超过5个节点。网络中包含500多个节点,但平均路径长度不足5,表明该网络表现出小世界现象。
但是,网络的聚集系数约为0.183,分布情况如图3所示,最大连通子图的聚集系数为0.192。许多现实网络中具有小世界现象,往往表现出很高的聚集系数,但工业机器人标准引用网的聚集系数并不高。一是因为网络在构建过程中,是通过“工业机器人”在标准馆藏库中以“工业机器人”为关键词借助全文搜索得到的核心标准集,然后对其规范性引用文件完成第一层的标准集和规范性引用的扩充,在馆藏库中该领域的相关标准数量有待丰富。另一方面,在图中3中,C(k)与k之间已经出现了幂律形式,存在部分节点度值不小,但聚集系数值非常小的现象,这表明该网络有社团聚集发展趋势,但因为工业机器人行业标准发展不成熟,部分标准的引用关系较为零散,产学研结合不到位,不同领域专家组织间的合作交流不畅,使得各板块领域间的关系缺乏深入研究。另外,机器人整体制造工艺复杂,涉及众多行业领域,如应急响应机器人、医用电器设备以及电磁兼容相关部分的标准,涉及机器人的本体、应用场景以及核心零部件等领域,纵跨工业机器人产业链上中下游,在高速发展阶段,各组织百家争鸣,将关键技术协商一致转化为标准文本,难度非常大。
图3 网络的聚集系数
标准在社会经济发展中具有重要作用,是产品质量提质升级、城市管理水平提高的重要基础。智能机器人重点布局立足国家安全与装备、服务于国家民生科技、服务于未来引领科技平台。我国工业机器人凭借广大的市场潜力和众多资源基础,近年来迅猛发展。随着人类社会的日益网络化,科学研究的网络化日趋明显,标准作为市场经济与科学研究结合的成果表现,是否也呈现出相同的趋势,在工业机器人这个处于高速发展阶段且标准化工作不成熟的领域,其系统内部的发展规律和趋势又反映出标准系统存在哪些问题。
本文通过关键词在上海市质量和标准化研究院馆藏系统中搜索工业机器人领域的相关标准,并通过规范性引用文件及引用关系,拓展标准集、制定连边规则、建立网络模型。利用网络科学相关理论和技术,对网络的稀疏性、度分布情况、小世界现象等基本拓扑性质展开计算和研究分析。经实验分析证明,不仅在发展较为成熟的日化用品行业领域的标准系统中,利用标准间的规范性引用关系建立的引用网络符合幂律分布,且在机器人这个新兴产业中,工业机器人领域的规范性引用网络也符合幂律分布和稀疏、非均匀的特点;小世界现象不仅存在于较为成熟的行业领域复杂系统中(如日化领域),也存在高速发展的行业领域(如工业机器人领域)中;处于发展不成熟阶段的工业机器人领域,反映出标准制修订相对滞后,标准间虽呈现聚集趋势,但部分标准的引用关系较为零散,产学研结合不到位,不同领域专家组织间的合作交流不畅,使得各板块领域间的关系缺乏深入研究等问题。