刘春林
中通服咨询设计研究院有限公司
工业互联网平台作为互联网及云计算、大数据、人工智能等新一代信息技术与现代工业深度融合的载体,是经济社会提质增效发展的重要驱动力量。从行业层面来看,工业互联网的创新发展将为工业企业提升效率和质量、降低成本和能耗带来巨大的积极效应;从国家层面来看,工业互联网作为国家战略,可以为科技创新、市场创新、制度创新的协同发展提供最佳机遇。本研究依据对我国工业互联网平台建设、实践的理解,结合中通服咨询设计研究院有限公司对工业互联网平台的开发研究经验,从基础共性工业互联网平台的能力建设展开探究。
一个成熟的跨行业、跨领域基础共性工业互联网平台,需要具备覆盖主流工业设备接入场景的工业物联系统,需要具备数据存储、集成、挖掘、分析的工业大数据系统,需要提供工业应用软件的开发、测试、发布等全过程管理的能力平台,需要建立工厂端到用户端的工业安全保障机制,以服务于流程、离散等各类型工业企业研发设计、生产制造、运行维护、经营管理的全领域过程,形成汇聚生产企业、行业知识专家、应用开发者、设备制造厂商等多方参与的开放生态。基础共性工业互联网平台框架结构如图1所示。
图1 基础共性工业互联网平台框架结构
平台需要具备完善的工业设备接入服务能力,以及覆盖主流工业控制器和工业传输协议的解析能力,依托现场侧工业网关进行工业设备组网实现各类设备便捷接入,基于平台侧高性能数据处理和边云协同能力实现各类设备信息快速上云。
(1)覆盖主流工业协议
覆盖主流工业协议,其中OPC、Profibus、Modbus这类行业通用协议需要做到全支持,同时还需要兼容国内外主要自动化厂家的自定义通讯协议,例如:西门子-MPI、三菱-CCLink、GE-CCM、施耐德-MODICON等。基于平台工业协议解析库能够实现各类应用场景下设备的一站式接入,无需进行协议开发,减少通讯调试时间,统一设备接入方式。
(2)高效边云协同计算
高效的边云协同计算能力,能够更好地支撑本地业务实时处理与执行,有效缓解云端计算和网络传输压力,降低硬件投入成本,数据私密性也能得到一定保障。主要体现在以下几个方面:
数据协同:基于平台侧数据挖掘、分析,与边缘侧数据采集、清洗、诊断实时同步,依托边缘侧工业网关根据用户业务需求动态变更数据采集、转发频率与范围等数据参数,高效利用网络、存储、计算等资源设施,实现数据资源协同。
模型协同:基于行业知识模型的平台侧训练优化并下发和边缘侧运行的有效分离来进行推理决策,依托边缘侧计算资源与模型加载功能实现设备自主智能化运行,保障边缘侧数据私密,缓解平台侧计算压力,提升设备运行效率。
应用协同:依托边缘侧工业网关功能的软件定义,基于Docker技术的平台侧下发应用镜像至边缘侧,平台侧执行对边缘侧应用的全生命周期管理,实现根据具体业务需求的边缘业务个性化定制。
服务协同:通过平台侧定义任务执行逻辑,对边缘侧业务进行合理编排,结合具体场景实现服务逻辑的协同。
(3)便捷设备资源管理
平台的设备管理能力面向工业企业生产及运营用联网设备的连接管理,需要支持对设备的远程参数修改、功能设定、维护管理等操作,从而有效提升设备的管理效率。同时,依托边缘侧的工业网关,实现平台建设的逻辑算法、行业知识库、AI模型等边缘计算模式,基于平台与边缘协同提升设备的运行效率。
例:不同工业场景下的数据连接方式,如图2所示。
图2 不同工业场景下的数据连接方式
场景1:边缘侧建设有较完善的DCS控制系统,可以通过工业以太网形式实现设备批量连接。
场景2:边缘侧存在大量分散PLC控制器,可以通过现场总线实现设备的分散连接与数据汇总发布。
场景3:边缘侧存在大量孤立设备,可通过低功率无线技术实现智能传感器快速组网。
平台需要支持PB级的工业数据分析处理能力,为海量高并发的生产、制造、经营等过程数据提供存储、计算、分析的能力支撑。基于主流的数据挖掘、机器学习、人工智能等技术,提供工业大数据的挖掘与分析,建立故障诊断、故障预测、健康评估、质量控制、目标识别等行业数据知识模型。
(1)数据存储和计算
工业大数据80%以上来源于生产过程中的设备运行状态监测、检查与分析结果反馈所产生的实时数据,这些数据带有时间标签,按照时间的顺序变化,行业中把这些带时间标签的数据称为时间序列数据。这些数据产生频率快(每一个监测点一秒钟内可产生多条数据),严重依赖于采集时间(每一条数据均要求对应唯一的时间),监测点多、信息量大(常规的实时监测系统均有成千上万的监测点,监测点每秒钟都产生数据,数据量每天可达几十GB),读写并发量高(往往是由百万级甚至千万级终端设备产生)。
基于以上工业数据的特点,建设基础共性工业互联网平台的基础设施资源,需要结合时序数据库技术以及工业大数据系统,提供满足平台需要的存储能力和计算能力,并可实现基础设施资源的按需动态扩容。
(2)数据分析和应用
平台需要提供面向多源异构数据的存储、计算、分析、建模的全流程管理服务,同时围绕人工智能与工业场景的结合,在诸如生产故障预测、能耗管理分析、目标智能识别等场景,构建深入的应用实践。
数据方面,平台需要提供典型行业工业场景的数据集,支持用户数据导入与交易,并由此建立起一个良好的数据资源生态体系,实现工业企业数据资源的高效便捷对接。
算法方面,平台需要具备典型行业工业数据分析所需的常用算法库,并提供针对生产故障预测、参数异常分析等特定场景的AI算法,实现业务模型的快速构建和训练。
模型方面,AI建模已经成为解决企业业务建模的重要手段,平台提供的计算和建模分析功能,可以实现AI建模流程可视化、标准化,提供建模过程中模型特征、模型训练、算法及参数调优、模型评估、模型发布的全过程管理,实现业务模型快速迭代开发。
发布功能,平台提供的模型发布功能,可实现用户自定义发布模式及访问权限,以微服务组件的形式开放API访问接口。同时,需要具备实时监控模型调用次数等信息的能力,以评估所发布模型的受欢迎度。
工业大数据服务方式如图3所示。
图3 工业大数据服务方式
平台采用“微服务构架+容器”技术,提供包括业务模型管理、算法组件、账单计费、消息通知、服务目录、统一运营等多样化应用支撑能力;平台构建开发者服务生态,提供从底层运维管理、设备接入、设备管理、数据管理、数据分析、应用开发、安全管理等多方面开发管理能力。
(1)开发管理服务能力
平台需要具备主流开发语言编译环境、开发辅助工具、算法模型库,并具备图形化编程环境,以支撑工业应用软件的敏捷开发和快速构建,从而满足多行业、多领域、多场景的开发需求。
开发语言编译环境:平台提供面向多种开发语言的开发工具、编译环境和代码托管服务。其中,主流开发语言的在线编译和发布包括Java、JavaScript、C#、Python、Ruby等,同时提供代码仓库,用于代码的托管和备份,开发者只需关注业务实现,无需关心编译、集成和运行环境。
开发辅助工具:丰富的工具集可以有效提升开发者的开发效率。通过可视化界面,快速构建各类工业应用软件,缩短软件开发时间,实现开发、测试、部署以及运维的更大灵活性。范围涵盖但不限于:设计类(流程设计工具、原型设计工具、表单设计工具)、数据处理类(爬虫工具、机器学习工具、数据可视化工具、AI建模工具)、应用开发类(微服务代码生成工具、通讯协议解析工具、API开发管理工具)、开发管理类(敏捷开发管理工具、开发知识管理工具、开发测试管理工具、应用部署工具、源代码管理工具)等。
算法模型库:多场景、多任务的算法模型库,内容应涉及人脸识别(可以是基于多任务级联卷积神经网络的人脸检测算法)、文本分类(可以是基于词频与逻辑回归的多标签分类算法)、异常检测(可以是基于时间序列重建误差的数据异常检测算法)等方面。
(2)交付管理服务能力
平台按照软件项目自动化交付流程提供包括开发、测试、发布的一整套工具集,涵盖环境资源,源码管理,缺陷检测、编译、配置,自动化测试,运行监控等类别中的主流工具,为开发者提供包含开发、测试、发布、运维等服务在内的全流程服务,实现工业应用软件的开发运维一体化服务能力。
平台提供应用市场,开发者通过可视化控制台上传镜像,将所开发的工业应用软件发布到市场。基于可视化控制台,开发者可以对应用进行创建、部署、启动、删除等操作;基于应用市场,平台能够对应用的发布、审核、购买、使用等环节进行全过程管理。对于发布到市场中的每个应用,平台具备监控分析功能,从而精准发现已发布应用的异常状态和性能瓶颈,实现数据化运营能力。
软件项目交付流程如图4所示。
图4 软件项目交付流程
(3)工业软件管理能力
新技术、新理念服务于工业企业的关键在于能否将数据转化为信息、将信息转化为知识、将知识转化为应用。工业应用软件是工业生产过程中隐性知识显性化的载体,是工业创新知识长期积累、沉淀并在应用中迭代进化的产物,根植于工业,但脱胎于工业。这些工业应用软件需要按行业标准在生产工艺的基础上结合新技术、新理念进行开发,服务于工业企业用户,是平台的价值出口,工业应用软件的开发离不开业务模型的建立。
平台将各行业的生产经验及各领域的过程知识封装成业务模型,并提供云化的设计、开发、管理环境,基于业务模型和云化环境,开发者可以快速构建工业应用软件,业务模型以API接口形式供开发者调用,所构建的工业应用软件在平台发布后供工业企业订阅使用。
业务模型:平台业务模型是根据对象、生产过程的内部工艺机制、物质流的传递机理建立起来的精确数字模型,并通过大量参数的训练提高模型的精准度。常见的业务模型分为基础类和业务类,基础类包括数据类、服务类、管理类、安全类等,业务类包括行业生产过程、资产管理、边缘计算、运营协同、市场营销等。
应用软件:基于平台提供的开发环境、开发工具、算法组件、业务模型,开发者将掌握的工业知识和经验与IT技术融合,开发出满足特定场景、特定需求的工业应用软件,服务于流程、离散等各行各业。常见的工业应用软件主要有:生产工艺管理、生产过程控制、设备故障预测、产品质量追溯、仓储物流管理、供应链管理、产业链协同、备品备件管理、能效分析优化、制造系统设计、制造流程仿真等。
云化管理:结合对工业互联网的发展趋势、工业应用软件构建模式及云化技术的应用普及,平台需要面向多行业、多领域、多区域提供研发设计、生产制造、运维服务、经营管理等智慧应用的云化能力,为行业和生态的可持续发展提供有力支撑。
(4)业务应用迁移能力
基于基础共性工业互联网平台开发的业务应用,需要支持在不同工业PaaS及IaaS平台间的顺畅迁移,以适应不同用户的个性化部署需求。
平台依托主流Docker容器技术,将基于平台开发的业务模型、微服务组件、各工业应用软件以及所依赖的环境完整的打包成镜像,实现不同工业PaaS平台的兼容性部署。平台具备完善的业务应用迁移管理能力,以支撑业务运行的连续性和迁移的安全性,并适配不同的工业IaaS平台,开发者可以基于平台提供的数据库复制技术(支持数据库日志复制和克隆)、系统复制技术(支持操作系统级别的数据复制)、数据复制技术(支持磁盘镜像和异步实时复制)来实现所开发资源的数据库迁移、应用系统迁移、数据迁移。同时,平台针对所要迁移的资源,提供关联风险、迁移风险的评估以及对应的推荐方案。
(5)用户及开发者管理能力
平台需要具备对企业用户及开发者进行管理的能力。平台将计算能力、模型能力、专业算法、工业数据向认证的企业或者开发者开放,企业或者开发者可基于这些开放的能力进行工业应用软件的构建,形成一个创新、创造的工业互联网平台生态体系。生态体系内,开发者可基于应用市场向企业用户提供工业应用软件,实现技术价值的最大化;企业用户可在应用市场上选购、试用所需的工业应用软件,也可以提出个性化定制需求,开发者根据需求来重新开发满足企业需求的服务。
应用发布:经过实名认证的开发者可在平台上发布开发的工业应用软件,介绍应用的功能、应用细节、购买细节和兼容性。
应用审核:平台拥有者对开发者发布的应用软件进行审核,全面审核软件的功能匹配度、安全性和合规性。
应用购买:企业用户可在应用市场搜索、浏览、选购、评论应用软件,定制满足企业需求的服务。
应用管理:企业用户、应用开发者可在自己权限范围内对应用的信息进行编辑,对应用的使用情况进行监控,对应用进行全面的管理。
应用专区:针对特定的行业、特定的应用场景、特定的企业提供专区服务,便于根据工业企业的应用场景选择应用套件,简化应用购买的过程,提高整体应用效果。
企业用户及开发者一般都常年专注某个信息化、工业化领域建设,基于基础共性工业互联网平台所提供的能力,依托企业用户及开发者提供个性的场景化解决方案,来真正满足不同客户的差异化需求,很多创新型的应用建设,就是在这种模式下诞生的。
工业互联网打破了工业控制系统传统的封闭格局,考虑到工业控制层、设备层、网络层、平台层以及数据层的安全问题,要求平台建立覆盖工厂端到用户端的工业安全保障机制,来有效解决网络非法入侵、设备未授权接入、数据泄露及篡改、应用系统漏洞被利用等典型安全问题。
(1)管理与认证
通过对生产控制区域(SCADA、PLC层)与生产管理区域(MES、ERP层)的分区管理,并在生产控制区域和生产管理区域之间增加访问控制以及单向安全物理隔离装置,实现网络的横向隔离。同时,结合访问者的身份授权认证机制,依托分区管理实现纵向认证,全面提高生产控制网络和生产管理网络的整体安全性。
(2)授信与鉴别
对于边缘侧终端设备接入的管理:首先,接入设备利用边缘网关对终端本身的基本信息、网关时间戳进行签名处理,形成终端设备标签,实现终端设备在网络上的唯一标识,此标识具有唯一性和不可伪造性。之后,边缘网关通过验证设备发送请求标签的身份和权限进行合法性认证,未经认证的设备所发出的请求不被接收执行,避免攻击者通过截获报文获取合法地址建立会话、数据遭到非法篡改,实现终端设备到网关的可信接入。
(3)隔离与防护
平台基于沙盒加密技术,采用容器隔离来实现终端设备、应用系统、算法库、模型库、用户数据等的安全防护,当使用者操作涉密数据时,将涉密数据移至容器,对数据进行控制、加密保存,依托先进的磁盘、文件、网络过滤驱动等防泄密技术使全过程透明无感知,保障数据使用安全。
(4)感知与分析
基于大数据的安全防护技术,通过采集应用安全相关的数据,运用机器学习、行为识别、关联分析等方法,构建业务应用安全画像,实现安全信息的挖掘汇聚、安全事件的智能分析、安全状态的趋势预测,防御网络攻击行为、应用漏洞利用、安全异常事件,以及对未知威胁的动态感知。
建设基础共性工业互联网平台,形成一系列面向工业场景的创新解决方案,对于引领行业工业互联网平台建设、应用与推广,助力制造业转型升级具有重要意义。平台建设过程中遇到的主要技术难点如下:
(1)多源异构数据集成和管理
根据系统特性,企业已经部署的系统都有各自的数据模型和引用标准;根据设备特性,生产现场有振动、超声、红外、电流、频谱等多种检测技术的采集特征数据;根据网络特性,工厂内各异的网络现状,采用有线或LoRa、4G/5G等无线技术数据传输。这就要求平台支持断点续传、时钟校准、数据多维集成等功能,用以实现多源异构数据的有效集成和管理,解决工业数据中数据不全、数据质量差、数据孤岛等问题。
(2)人工智能和业务场景融合
人工智能在机器视觉、目标检测、语音识别、语义理解等方面已经有了比较成熟的应用,但与工业业务的深度融合还处于起步阶段。如何将人工智能技术与工业大数据技术结合,与工业的具体业务场景深度融合,是平台建设需要考虑的重要问题之一。例如:将机器视觉和工厂作业票业务融合,主动及时识别现场人员操作不规范问题;通过采集设备实时数据,结合算法组件,构建设备故障预测模型等各类具体业务应用。
(3)建模平台适配不同行业领域
流程、离散行业的生产过程和工艺有着非常大的差异,数字工厂建模平台如何通过通用的模型来支撑,业务建模平台又如何支持不同行业、场景下的工艺模型和设备模型,模型训练所依赖的数据集和验证集如何根据场景不同进行差异化区分和建设,平台建设如何适配不同行业、不同场景的用户需求,这也是面临的技术难点。
(4)大量工业应用软件的质量管理
工业互联网平台需要培育大量的工业应用软件,而这些工业应用软件的开发者可能来自不同组织,所采用的技术存在很大差异,平台要通过自动化结合人工的方式对这些来自不同组织的工业应用软件的质量进行检测和管理。
现阶段,我国工业互联网平台建设在总体研究、技术标准、产业生态、政策引领等方面步伐逐渐加快,平台在夯实工业革命发展基础、支撑制造业由大到强转变、助力实体经济和数字经济融合发展等方面发挥了重要作用。但从落地实践来看,工业互联网平台建设本身还处于需要多要素深度融合、新技术迭代更新、多场景业务拓展、商业模式持续创新的复杂过程中。