基于知识图谱的国外工业互联网研究现状及趋势分析

2022-10-03 05:17李向东何有龙耿立校
制造业自动化 2022年9期
关键词:聚类文献工业

李向东,何有龙,耿立校*

(1.河北工业大学 经济管理学院,天津 300401;2.河北工业大学国家技术创新方法与实施工具工程技术研究中心,天津 300401)

0 引言

制造业数字化是全球领先国家提高产业竞争力的重要战略,在推进数字化进程中,世界主要国家将工业互联网作为制造业转型升级和重塑未来竞争优势的重要手段。根据美国通用公司(GE)等权威机构的分析,2030年全球工业互联网将达到15万亿美元的经济价值,将影响全球一半的经济规模。未来工业互联网还将从环保、医疗等领域产生社会价值,成为各国抢占制造业竞争制高点的共同选择,也是我国实现制造强国和“弯道超车”的重要途径[1]。

工业互联网的概念最早由美国GE公司于2012年提出,随后美国成立了工业互联网联盟(Industrial Internet Consortium,IIC),这一概念也随之被大力推广。近年来,全球主要国家纷纷提出了发展工业互联网的规划,例如美国的“先进制造领导力战略”,德国的“工业4.0”计划,日本的“互联工业”,法国的“新工业法国”,以及英国的“英国制造2050”等。我国于2015年5月发布《中国制造2025》,提出重点发展工业互联网;2017年11月,国务院印发了《关于深化“互联网+先进制造业”发展工业互联网的指导意见》,明确了我国工业互联网发展的主要目标和任务。尽管各国在发展工业互联网中采取的具体措施、切入点和名称都各不相同,但本质都是利用云计算、大数据、人工智能等新一代信息技术推动制造业向数字化、网络化和智能化转型,与我国通过工业互联网推动制造业转型的逻辑是一致的。

工业互联网的本质是通过互联网将各类制造资源与创新资源相互连接,对多源数据的感知、分析和数据挖掘,实现物理系统和虚拟系统的巧妙融合,从而形成“机机互联、人机互联”的新制造业体系[2]。工业互联网的内涵可以从构成要素、核心技术和产业应用三个角度来阐述,从构成要素来看,人、机器和数据共同构成工业互联网生态系统;从核心技术来看,工业互联网是物联网、大数据、云计算等新一代信息技术的有机结合;从产业应用来看,工业互联网是信息技术在工业领域的应用和拓展,主要包括数据采集与传输、数据分析、决策反馈三个方面,面向行业涉及制造业、能源、医疗健康、金融等。作为工业互联网的三大要素,工业互联网平台是工业资源配置的核心,是打造制造企业竞争优势的关键,国外也相继涌现出众多的工业互联网平台,例如GE的Predix平台、PTC的ThingWorx平台等。

随着工业互联网的全面布局和发展,学术界针对工业互联网的体系架构、相关使能技术等做了大量研究。本文通过检索Web of Science(WoS)数据库中的工业互联网相关文献,运用CitespaceV绘制国外工业互联网研究的合作网络图谱、文献共被引图谱和关键词共现图谱,对国外工业互联网的研究现状和研究热点进行梳理,探究国外在工业互联网领域的研究趋势和方向。

1 数据来源与研究方法

1.1 数据来源

基于WoS数据库,以industrial internet、industry 4.0、internet of things、industrial internet of things、IoT、IIoT为关键词在标题中检索,具体检索设置如表1所示。通过在研究过程中不断更新文献,累计得到文献7678篇,剔除相关性较低的文献后得到1940篇有效文献用于计量分析。

表1 WoS中“工业互联网”检索设置

1.2 研究方法

采用文献计量的方法来分析国外工业互联网相关研究的演化进程及其相互关系。文献计量法是指运用数学和统计学等计量方法,以文献为研究对象,定量分析文献间的联系,以探究某个研究领域的知识结构、演化规律及热点的研究方法[3]。采用动态网络分析的信息可视化技术和工具—CiteSpace软件进行文献共被引分析和聚类分析,绘制工业互联网研究和发展的知识图谱,揭示工业互联网研究领域的代表人物、代表文献和主要合作网络,展示国外工业互联网研究的发展演化路径,并探讨未来工业互联网的热点主题和研究方向。

2 国外工业互联网研究的描述统计

2.1 工业互联网研究的发文量

为探索国外工业互联网研究的演化发展规律,对WoS中工业互联网研究文献的年发文量进行了统计,如图1所示。可以看出,国外对工业互联网的研究可以划分为三个阶段:第一阶段为2012年至2014年,该阶段处于工业互联网研究的起步阶段,因此发文量较少且没有显著的增长趋势;第二阶段为2015年至2017年,该阶段工业互联网研究文献的发文量显著提高,但没有明显的增长趋势;第三阶段为2018至今,该阶段是工业互联网研究的快速增长阶段,不仅发文量上升,还具有高速增长的趋势。自2012年美国发布工业互联网战略以来[4],国外工业互联网发展迅速,工业互联网研究文献的发文量与工业互联网的发展趋势基本吻合。

图1 WoS中工业互联网文献发文量

2.2 工业互联网研究的学科分布

通过分析工业互联网研究的学科分布可以了解工业互联网应用和发展的主要方向和领域。对WoS中的国外工业互联网相关研究文献的学科类别进行了统计,由于数据量较大,本文筛选了文献量大于100的WoS类别,结果如图2所示。

图2 WoS中工业互联网学科类别

从学科分布可以看出,发文量多的学科与工业互联网的应用场景和相关使能技术具有较强的相关性,主要有电气电子工程领域、电子通信、计算机以及工业工程等。网络是工业互联网的基础,计算机、传感器等技术设备和基础设施是工业互联网的关键支撑,对工业互联网关键技术及其应用的研究仍然是未来的主要方向。

2.3 工业互联网文献的来源国家

本文统计了WoS中工业互联网相关文献的来源国家,如图3所示。统计结果显示,美国是工业互联网研究发文量最多的国家,其发文量显著高于其他国家,发文量为356篇,占总发文量的18.35%;其次是西班牙,其发文量为217篇。另外,德国、英国、意大利等国家的发文量也超过了100。

图3 WoS中工业互联网文献来源国家

3 工业互联网研究的合作网络分析

3.1 国家合作网络分析

图4是WoS中工业互联网相关文献的国家合作网络。从连接线数量来看,美国的连接线最多,其中心性达到0.24,说明美国是参与工业互联网合作研究最广泛的国家。另外,德国、日本、英国等发达国家也呈现出较强的合作关系和合作网络。可以看出,国外对工业互联网研究的国家已经形成了以美国、德国、英国等国家为核心的合作网络,且呈现合作范围扩大的趋势。

图4 WoS中工业互联网研究的国家合作网络

3.2 发文机构合作网络分析

发文机构合作网络分析是通过绘制某个研究领域或主题下的合作网络,来分析目前该领域领先的研究机构。运用Citespace绘制了WoS中工业互联网研究文献的发文机构合作网络图谱,如图5所示。从连接线数量来看,康奈尔大学、世宗大学、瓦伦西亚理工大学的连接线最多,中心性都为0.05,与其他研究机构的合作最广泛;另外,根特大学、北里大学等也具备较高的中心性。总体而言,国外对工业互联网研究的机构以大学为主,并呈现多点开花的局面,并初步形成了工业互联网研究的机构合作网络。

图5 WoS中工业互联网研究的科研机构合作网络

3.3 作者合作网络分析

了解一个领域的核心作者以及作者间的合作关系,对于把握该领域的科研动态和研究进展具有重要的参考价值[5]。运用CitespaceV绘制了WoS中工业互联网研究文献的作者合作网络,如图6所示。

图6 WoS中工业互联网研究的作者合作网络

可以看出,国外对工业互联网研究的作者形成了分别以Kumar、Vilajosana、Sisinni和Hoebeke为核心作者的四个主要合作网络。其中,以Kumar为核心的合作网络主要关注信息物理云系统(Cyber Physical Cloud Systems,CPCS)中边缘计算、云计算和大数据的应用,以及CPCS在医疗、环保等领域的应用拓展[6];以Vilajosana为核心的合作网络主要关注低功耗无线传感器和传感网络及其在工业互联网中的应用[7];以Sisinni 为核心的合作网络主要研究无线通信、智能传感器以及传感网络在工业领域的应用[8];以Hoebeke为核心的合作网络主要关注工业无线传感器和执行器网络在工业环境下的优化和适用性研究[9]。

4 工业互联网研究的演化进程

为探索国外工业互联网研究的主题及其演化路径,对WoS数据库中的工业互联网相关文献进行共被引分析和聚类分析,并对高被引文献进行梳理。由于国外主要国家在发展工业互联网过程中形成了不同认识,对工业互联网研究的切入点存在差异,但本质都是利用云计算、大数据、物联网、人工智能等新一代信息技术实现人、机器和数据的互联互通,工业互联网融合了工业4.0、物联网和工业物联网等相关概念和技术,因此,本文将工业4.0、物联网、工业物联网的相关文献均纳入工业互联网研究范畴。

4.1 文献共被引分析

通过文献共被引分析可以明确该领域的研究重点和方向,同时可以挖掘高被引的关键文献。本文对WoS中工业互联网研究的相关文献进行共被引分析(如图7所示),并筛选了共被引次数前10的文献(如表2所示)。

图7 WoS中工业互联网研究的文献共被引图谱

结合图7和表2可知,共被引次数最多的文献是Xu等[10]关于物联网的文献综述,对物联网的发展现状、关键使能技术以及物联网在工业领域的应用进行了总结。物联网是构成工业互联网的关键技术,深化物联网研究对于促进工业互联网发展至关重要。Gubbi等[11]认为安全与隐私、参与式传感、数据分析、云计算等是物联网发展的关键。Al-Fuqaha等[12]通过分析物联网中的协议和应用问题,探讨了物联网与大数据、云计算、雾计算等新兴技术的关系,并提出物联网服务之间进行横向整合的需要。

表2 引用次数前10的共被引文献记录

4.2 文献共被引聚类分析

在CiteSpace中,以1年为时间切片,根据每个切片中的g-index指数,将比例因子k设置为25,然后采用LLR算法从施引文献的标题中提取聚类标签,共得到188个聚类。本文筛选了相关性最高的8个聚类(如表3所示),并绘制了聚类的时间线图谱(如图8所示)。由图8可知,聚类的模块值(Q值)为0.7831,大于0.5,表明图谱的聚类结构显著;聚类的平均轮廓值(S值)为0.8387,大于0.7,说明聚类结果是合理有效的。本文对每个聚类的演化过程、主要研究主题和经典文献进行详细论述。

图8 WoS中工业互联网研究的聚类时间线图谱

表3 WoS中工业互联网共被引文献聚类信息

聚类#1是机器学习的相关研究,包含机器学习算法、机器学习在工业互联网中的应用等。机器学习是实现人工智能和大数据分析的重要方法,工业互联网平台是人工智能应用的重要载体,已被应用于工业互联网的安全防护、人机交互、数据分析、工业图像等多个场景。聚类#1中的最高引用者是Al-Garadi等[20]对可用于物联网安全防护的机器学习方法和深度学习方法的探索研究,认为机器学习和深度学习能有效解决物联网感知层、网络层和应用层的安全问题,比如数据安全、设备检测等。

聚类#2是工业互联网的综述研究,包含工业互联网的概念、体系架构、相关使能技术、安全与隐私等。聚类#2中的最高引用者是Culot等[21]对工业4.0的文献综述,该研究通过分析工业4.0的近100个定义和相关概念,来解决“智能制造”、“数字转型”和“第四次工业革命”的概念易混淆的问题,发现工业4.0与智能制造、云制造、工业互联网等在技术和应用等层面存在明显的交叉关系。

聚类#3是云计算的相关研究,包含云计算体系结构、安全和资源监控等。云计算是推动工业互联网发展的关键技术,为不同工业场景提供分布式、低成本数据计算能力,其通过基础设施即服务(Infrastructure as a Service,IaaS)、平台即服务(Platform as a service,PaaS)、软件即服务(Software as a Service,SaaS)等多种形式实现数据和资源的管理。聚类#3中的最高引用者是A.Al-Sharif等[22]关于云计算资源分配的研究,提出了自主云计算资源分配框架(Autonomic Cloud Computing Resource Scaling,ACCRS),以提高云计算系统的利用率,降低成本和功耗。

聚类#4是大数据分析的相关研究,包含大数据分析及挖掘技术、大数据存储及管理技术以及大数据安全等。工业互联网大数据功能架构包括数据采集与交换、数据预处理与存储、数据建模、数据分析、以及决策与控制应用。聚类#4中的最高引用者是Khanra等[23]对大数据在企业中应用现状的文献计量分析,认为大数据分析工具、分析领域选择以及道德与法律是大数据在企业应用中面临的主要问题。

聚类#7是数字孪生的相关研究,包含数字孪生应用模式、仿真算法、标准体系等。数字孪生是工业互联网平台体系的关键技术,通过数字孪生可以获取物理实体全生命周期的运行诊断、预测和决策信息,提高工业APP开发、测试、部署的效率。聚类#7中的最高引用者是Minerve等[24]对物联网背景下数字孪生的文献综述,该研究从数字孪生的相关技术、应用场景和架构模型等方面阐述了数字孪生的概念,认为数字孪生已在学术界和工业环境被广泛采纳,软件化和服务化是数字孪生未来发展的重要方向。

聚类#8是低功耗无线传感器网络的研究,包含无线传感器网络、机器对机器通信、低功耗无线局域网和射频识别技术等。无线传感器网络是传感器、计算机、无线通信和微机电技术的集成,已被广泛应用于工业环境监测、智能工业、智能电网等多个领域。聚类#8中的最高引用者是Granjal[25]等对物联网安全的文献综述,认为低功耗无线传感器网络的专业化和标准化是影响物联网感知层安全的关键。

聚类#9是智能合约的相关研究,包含智能合约的制定、应用和安全等。智能合约是运行在区块链数据库中的计算机程序,是通过计算机语言取代法律语言来记录条款的合约,具有数据透明、不可篡改、永久运行的特点。基于区块链技术的智能合约是工业互联网安全和信任体系建设的关键,能够增强工业互联网数据的可信性、可靠性和安全性。聚类#9中的最高引用者是Lockl等[26]对物联网体系中信任问题的研究,该研究针对物联网数据不透明的问题,提出了基于区块链的物联网传感器数据记录和监测系统,提高了数据的完整性和可用性,但智能合约计算费用也带来了高额运营成本的问题。

聚类#10是关于深度学习的研究,包含深度学习算法、深度学习的应用等。深度学习是机器学习中的一个新的研究方向,是促进人工智能发展和应用的关键技术,以深度学习为主导的人工智能被应用于工业互联网平台的设备层、边缘层、平台层、应用层等四类应用场景,正推动传统生产模式向实时感知、动态分析、科学决策、精准执行和优化迭代的智能化生产模式转变。聚类#10中的最高引用者是Al-Hawawreh[27]等关于工业互联网恶意活动识别算法的研究,该研究提出了一种基于深度学习模型的互联工业控制系统异常检测方法,该方法能利用TCP/IP数据包收集的信息进行学习和验证,结果表明该方法具有较高的检测率,可以在真实的互联工业控制系统环境下实现。

通过共被引聚类分析可以发现,国外关于工业互联网的研究主要可以分为两个方面:一是对工业互联网所涉及的相关使能技术的综述性研究,例如机器学习、云计算、无线传感器网络等方面的综述;二是为解决工业互联网中的技术或管理问题而提出的解决方案,例如面向工业物联网的低功耗无线网络、面向数据采集的无线传感技术、面向人工智能的机器学习算法等。

5 工业互联网研究热点及趋势分析

采用关键词共现的方法分析工业互联网研究的热点和未来的发展趋势,运用Citespace对WoS中工业互联网研究的文献进行关键词共现,关键词共现图谱如图9所示。

图9 WoS中工业互联网研究的关键词共现图谱

由于Citespace对于同义词识别的能力较弱,本文将同一概念的关键词进行人工合并,根据词频和中心性分别进行累加获得新的关键词共现结果,本文分别筛选了词频和中心性排名前15的关键词,如表4所示。

表4 工业互联网研究的前15个高频关键词

结合图9和表4可知,物联网是共现次数最多的关键词,其共现次数为596次。国外对工业互联网的研究多从物联网的角度展开,包含体系架构、应用现状、数据安全与管理、平台以及操作系统等。

工业互联网的体系架构一般包含四个层面,分别是传感层、网络层、服务层和应用层[10,28~30],传感层是指通过集成RFID、传感器等硬件工具来感知物理世界并获取数据;网络层是通过无线或有线网络来提供基础网络支持和数据转换;服务层是通过创建和管理服务来满足用户需求;应用层为用户或其他应用提供交互方式。虽然众多学者对工业互联网的架构进行了定义,但工业互联网系统的技术规范和参考架构还远没有完成和标准化[31]。Washizaki等[32]对工业互联网的设计模式和架构模式进行详细分类后发现,57%的工业互联网模式并不是特定于工业互联网设计的,尽管大多数工业互联网设计模式适用于任何领域,但工业互联网架构模式往往是领域特定的,这表明在特定领域采用工业互联网的独特性质出现在架构级别。

工业互联网还被广泛应用于物流运输、医疗保健、智能环境(家庭、办公等)、制造业、零售贸易、信息服务和金融保险等领域[28~33]。随着工业互联网在更多领域的应用,特定领域的工业互联网设计模式的数量将会增加。

在数据管理方面,学者们注重对数据获取、存储、转化、分析等技术的探讨。Li等[34]认为当前的工业互联网缺乏灵活性和智能性,通过软件定义网络(Software Defined Networking,SDN)和工业互联网应用产生的数据可以增强工业互联网控制和管理的灵活性和智能性。学者们针对数据和隐私安全问题也做了大量研究和讨论,普遍认为数据安全和管理是推动工业互联网健康稳定发展的关键[28,30,33,35]。因此,优化数据安全管理制度、建立标准的数据安全管理协议和体系将是未来解决工业互联网安全问题的挑战和难点。

在工业互联网平台以及操作系统方面,Mehmood等[36]设计并实现了一个以云为中心的工业互联网平台,该平台为虚拟物品提供注册和初始化服务,以便技术爱好者可以通过工业互联网市场使用该平台,并将它们整合起来构建工业互联网应用。Lee等[37]针对工业互联网服务平台相似性和可重用性提出了基于期望最大化算法(Expectation Maximization,EM)的工业互联网服务系统。Lee等[38]认为支持新的工业互联网硬件的开发,以及所有通信的最新标准和技术的工业互联网操作系统将是未来的发展方向。

另外,云计算、大数据、区块链等新一代信息技术与工业互联网加速融合。在工业互联网的网络层,云计算是制造业的关键驱动力[39],云计算能将资源抽象为服务,向用户提供无处不在的服务,例如SaaS、PaaS、IaaS等[40,41]。大数据分析可以帮助用户从庞大的数据量中挖掘有用信息,帮助用户快速制定决策。随着传感和通信技术的发展,获取覆盖工业生产各个阶段的实时数据变得越来越容易,借助云计算、数据挖掘等大数据分析技术可以帮助实现产品的智能更新,让用户了解产品全生命周期[39]。但大数据也面临挖掘深度不够、间断式和质量差的问题,须在未来研究中不断完善[42]。

6 结语

本文基于WoS数据库中工业互联网研究相关文献,采用文献计量的方法,运用CiteSpaceV绘制了合作网络图谱、文献共被引图谱和关键词聚类图谱,探究了国外工业互联网研究的演进过程、研究热点和趋势。本文的主要研究结论包括:

1)国外在工业互联网研究领域已初步形成国家、机构和作者的合作网络。分别绘制了WoS中工业互联网研究的国家合作网络、机构合作网络和作者合作网络。在国外,美国在工业互联网研究领域的发文量和连接线数量都位居第一,与其他国家之间形成了明显的合作网络,是工业互联网研究的主要国家。另外,德国、日本、英国等国家也表现出较强的研究能力和合作趋势。从机构合作网络可知,国外对工业互联网研究的机构呈现多点开花的局面,研究主体以大学为主,其中瓦伦西亚理工大学的连接线最多,与其他科研机构的合作最广泛。从作者合作网络来看,国外对工业互联网研究的作者形成了分别以Kumar、Vilajosana、Sisinni和Hoebeke为核心作者的四个主要合作网络,且四个合作网络研究的关注点存在差异,分别是信息物理系统、无线传感器、无线通讯以及工业无线传感网络。

2)演化进程包含8个主要聚类。通过绘制文献共被引图谱以及文献共被引聚类时间线图谱来探索工业互联网研究的演化进程。研究发现,国外对工业互联网研究的主题主要有机器学习、云计算、大数据分析、数据孪生、低功耗无线网络、智能合约和深度学习等。

3)研究热点、趋势及挑战

本文通过关键词共现的方法来分析工业互联网研究的热点。从关键词共现结果可知,国外工业互联网研究领域的热点主要有工业互联网的体系架构、应用、相关使能技术、数据安全与隐私。

首先,虽然国外已形成了一些主流的工业互联网体系架构,但已有对工业互联网体系架构的描述多关注底层技术,对于工业互联网的服务模式和应用创新的研究还相对不足。因此,完善工业互联的架构体系,拓展新的应用领域和商业模式将是未来工业互联网研究的重点。

其次,工业互联网使能技术是工业互联网运转的驱动力,加强现有技术的更新迭代以及新技术的创新是推动工业互联网发展的重要手段。随着新一代信息技术的发展和面向工业场景的二次开发,5G、边缘计算、区块链、工业人工智能、数字孪生将成为影响工业互联网后续发展的核心重点技术和不可或缺的组成部分。

最后,安全与隐私是工业互联网健康和持续发展的保障。已有对工业互联网安全和隐私的研究主要关注管理安全、数据安全、通信安全和终端安全,并分别从技术和制度两个角度提出解决方案。从技术角度提出运用射频识别、密码、沙盒、访问控制、通信授权等技术来实现数据的集成和管理;从制度角度提出建立智能合约或协议的方式规范数据管理。随着工业互联网中接入用户的数量增加,工业互联网安全和隐私管理方法的完善将更加重要。

猜你喜欢
聚类文献工业
一种傅里叶域海量数据高速谱聚类方法
基于知识图谱的k-modes文本聚类研究
基于数据降维与聚类的车联网数据分析应用
Hostile takeovers in China and Japan
基于模糊聚类和支持向量回归的成绩预测
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
掌握4大工业元素,一秒变工业风!
工业技术