刘银亮,刘晨,姚思家,解新保
(昆仑数智科技有限责任公司)
随着“德国数字化战略2025”“美国智能制造”等战略的提出,国家积极鼓励利用新技术进行企业数字化转型。数字化转型已经成为各行各业企业变革的方向,在石油行业里,“数字孪生”是管道数字化技术的重要应用[1]。
2020年4月7日,国家发改委和中央网信办联合发布了发改高技〔2020〕552号《关于推进“上云用数赋智”行动培育新经济发展实施方案》[2],把“数字孪生”创新计划列入其中作为数字化转型支撑技术,并提出开展数字孪生创新计划的工作举措。2020年8月,国资委下发《关于加快推进国有企业数字化转型工作的通知》,将数字孪生技术作为数字化转型的基础和关键技术[3]。2021年4月,工信部发布了《“十四五”智能制造发展规划》(征求意见稿)[4]提出加快创新网络建设、开展智能制造示范工厂建设、大力发展智能制造装备和深化推进标准化工作4个方面,多次涉及数字孪生体。
数字孪生由密歇根大学Grieves教授提出,并且提出DTP(数字孪生原型)、DTI(数字孪生实例)等概念。指出信息镜像模型,揭示了物理产品和虚拟产品二元性的含义[5]。使用虚拟产品代替物理产品的能力,体现了信息镜像模型的价值。数字孪生技术在当时主要被应用在航天和军事领域。
北京航空航天大学的陶飞团队提出了数字孪生通用抽象模型五维模型的概念,强调了与新技术结合、普适工业互联、智能服务等需求[6]。中国电子信息产业发展研究院提出数字孪生定义,强调数据是基础、模型是核心、软件是载体[7]。国际标准化组织ISO制定了制造业领域的数字孪生标准,提出了数字孪生体定义,强调数字孪生体是制造系统元素的数字表示,并且能够在制造元素与对应数字表示之间以合适的速率保持一致[8]。
数字孪生级别是根据物理实体与虚拟实体数据的映射情况、模型算法的研发情况、应用服务业务的支持情况而定。安世亚太科技公司提出数字孪生体的成熟度模型,认为数字孪生经过数化、互动、先知、先觉和共智等过程[9]。
数字孪生体的关键技术是数字主线,有学者也称数字线程。USAF(美国空军)利用数字主线技术(3D数字化)进行战斗机数字化设计取代了纸质蓝图,并将设计数据、工程数据、制造数据直接连接,从而减少了工程变更。
综上所述,各家都提出了自己对数字孪生体的认识,其中共同特点是都有数据、模型和应用服务,并且需要结合大数据、人工智能等IT技术实现。
管道是线性方式存在的,它的特点是线长、点多、环境复杂多样,需要解决的应用问题、解决方案、支撑的数据都有着自身的特性。国内管输企业在经过管道数字化、自动化发展之后,逐步提出了智能化的目标。同时提出了基于大数据、云计算、物联网等新IT技术的智慧管网顶层设计,实现管道的可视化、网络化、智能化管理,具有全方位感知、综合性预判、一体化管控、自适应优化的能力[10]。
在感知层面国内管道按照数据传输路径主要分为两种:一种是从管道伴行光缆上传数据的SCADA(数据采集与监视控制系统)系统,另外一种是利用供应商网络或卫星网络进行数据上传的物联网采集系统。
在专业分析应用层面,各企业按照所辖管道运行特点或特定业务问题,不同程度进行了地质灾害监测、管道智能防腐监测、油气泄漏检测、站场阀室周界防护、管道挖掘监测、视频安防监控、无人机巡检监测、天气自然灾害监测预警等系统的应用。
在业务管理层面,管输企业根据自身业务管理特点,先后经过“十二五”“十三五”信息化建设高峰期,逐步建立了符合自身业务管理的信息化系统,主要包括:工程建设管理系统、管道完整性管理系统、管道生产管理系统、管道ERP(企业资源计划系统)等[11]。
参考数字孪生体技术发展,对管道资产情况进行分析。管道资产通常经过设计、采办、建设、运行等阶段,不同阶段对应的数字孪生体的类型也不同(见图1)。
图1 数字孪生体类型与管道资产阶段关系
通过对管道生命周期进行分析,不同阶段的数字孪生体特点不同,但在针对具体业务应用和业务问题时,需要明确多个数字孪生体或不同类型孪生体之间的聚合关系和孪生体场景。在建设和运行阶段形成数字孪生体的聚合,产生多种聚合关系类型,如层级、关联和对等聚合等。
3.1.1 总体层级关系
结合管道物理实体对象和长输管道业务现状,管道实体按照层级关系可划分为:管网、管道和站场、站场设备和线路设施。
3.1.2 管网孪生体关系
管网孪生体的每个层级都又有层级、关联和聚合等关系。管网孪生体组成主要包括:管网、子管网、管线、站场和管段。其主要关系是:管网包含管线、管线聚合管段和管段关联站场等(见图2)。
图2 管道实体层次划分
3.1.3 管道孪生体关系
管道孪生体主要包括:管道、站场、线路及附属设施、周边环境、第三方设施、安全防护与监测系统等。主要关系包括:站场阀室关联管段、站场包含进出站口、站列关联收发球筒、线路包含附属设施、线路关联第三方设施、线路包含传跨越等。
3.1.4 站场孪生体关系
站场孪生体主要包括:站场、进出站口、管道线路、功能区、设备设施、工艺管段、工艺管段焊口、管道组件等。主要关系包括:站场包含设备、站场包含功能区、站场包含工艺管段等。
3.1.5 设备孪生体关系
设备孪生体主要包括:台套设备、单体设备、零部件、备品备件。主要关系包括:台套设备包含单体设备、单体设备聚合零部件、单体设备关联备件。
数字孪生体场景是指在某一个阶段将多种类型孪生体进行组合,形成相互影响和相互作用集合。例如,某天然气管道首站工艺运行场景,主要工艺流程包括:进站压力表和进站温度计、过滤分离器、流量计、压缩机、空冷器、出站温度计和出站压力表。对应由各种设备设计数据组成的孪生原型(如:某型号压力表),产生孪生实例(某站进站压力表,表温度,表型号等),多个孪生实例形成孪生聚合体(如5台过滤分离器聚合体),将主要工艺流程设备组合形成站场工艺运行的孪生环境,这个孪生环境的场景可以服务于站场生产运行等业务。
在数字孪生体场景下,通过分析各种算法模型从而解决业务需求,达到预期效果。例如:在输气管道中,压气站工作产生的能耗费用会对整个管道的能耗费用产生直接影响,必须对压气站的能耗进行优化,从而要求准确掌握压气站中各台压缩机的特性,建立模型对压缩机的综合效率进行优化。从20世纪 60年代,国内外学者纷纷提出运用变转速二次拟合法、神经网络等多种方法进行数学和大数据算法建模,分析压缩机特性曲线的变化规律。主要模型有利用物理公式和经验的机理模型以及利用数据驱动的大数据模型,通过分析模型,达到对压缩机性能优化。
通过对数字孪生技术应用的梳理可知,数字孪生技术主要包括三方面:数据、模型、应用(服务)。
数据是基础。数据的应用关键在于精准映射,通过数据感知、数据建模,将数据与物理实体之间进行映射。模型是核心。面向物理实体和逻辑对象建立机理模型或数据驱动的大数据模型,关键在于利用软件定义模拟或监测物理空间的真实状态和规则[7]。应用(服务)是数字孪生体的载体。通过数据流动、模型定义,将功能服务化,实现物理空间和虚拟空间的状态、辅助决策和持续优化等业务应用功能[7],解决业务问题。
若要实现物理实体与虚拟实体一一映射,需要全面的数据支撑,要求包括从设计、采购、建设各个阶段产生的数据,在以上关系基础上进行关联整合,作为工程交付内容给管道运行期应用。在运行期,物理实体还会产生运行期动态数据,主要包括:传感器监测数据、业务管理数据。
根据定义,数字孪生体可提供对应层级的数据。从管输企业对管道管理的数据需求考虑,结合管道业务以及数字主线概念,管道数字孪生体的数字主线主要分为两个方面:水平主线和垂直主线。
水平主线:主要解决从设计、施工到运维整个生命周期的数据传递及共享问题。涉及多个时间段,需要多阶段数据整合。这些数据主要是静态的基础参数,是随实物资产一同交付的数据资产,主要存在设计平台或工程施工建设管理系统中。垂直主线:物理传感器设备监测、专业计算和业务管理等数据的结合,解决运行期数据上传汇总,需要多源数据集成加载。主要包括:管道实体的运行监测数据、专业分析计算数据、各种业务管理数据。这些数据是随着管道运营期间的生产活动实时产生。
两条主线的数据不是相对独立的,对于复杂问题需要将水平主线数据与垂直主线数据融合关联,并进行数据的组织管理,体现数字孪生体层级和聚合关系,达到模型计算的输入要求,实现支撑应用的基础作用。管道数字孪生体模型信息与数据(主要包括资产交付数据、运行监测数据、专业分析数据、管理数据)要进行融合打通,数据需要进行集成、存储、管理,并按统一标准提供接口服务。
基于以上分析,在搭建平台时需要考虑:
一是建立以数字孪生体为中心的数据标准。数据从两个方向进行融合的前提条件是建立统一的数据标准。数据标准的建立需要以数字孪生体为中心进行标准制定。因此对物理实体的数据划分不光需要考虑单个物理实体的属性,更应该考虑数字孪生体的组合关系,包括:层级、关联、对等聚合,从而可以支持上层应用场景的数据服务。
二是以数字孪生体为中心的多阶段数据整合与管理。针对设计、采办、施工逐个阶段进行数据采集,需要针对相同实体对各阶段数据进行属性对齐更新和属性整合,最终能够达到准确的实体交付数据。
三是数字孪生体运行涉及多源数据集成。如物联网监测设备的采集系统、自动化数据采集系统、多个信息管理系统等数据。因此,受到通信协议、数据格式、编码等因素的影响,需要多系统与移交的实体数据进行集成关联,形成以统一孪生体实体为中心的运行期多业务、多源数据的集成。
模型定义了物理实体中各种运行、管理等规则。模型并非是将所有物理世界的规则一次性的全部建立,而是一个逐步完善的过程,要根据不同的业务问题进行逐步建模分析处理。通常依靠对管道业务及油气储运专业知识的研究和积累,利用已知的数学、物理、化学等机理公式针对业务问题进行建模分析。例如在设备故障诊断的场景中,压缩机故障诊断需要利用幅值域分析、时域分析、频域分析等分析方法,对压缩机系统测量信号进行分析[12]。这些方法都是基于对设备运行原理的了解和长期运维经验积累。这种建模方法的特点是利用已知的知识进行分析预测,结果是可解释的。
另外,随着各种传感器检测技术的发展使数据类型更加多样化,对于海量数据的处理分析技术也突飞猛进,使利用数据驱动进行建模分析成为可能。因此出现了利用基于大数据处理的机器学习和深度学习建模分析算法。例如在设备故障诊断的场景中,国内外学者多次提出利用神经网络和支持向量机等数据驱动的人工智能算法对阀门故障及压缩机性能进行诊断识别[13-15]。采用这种方法的前提是采集足够多的样本数据,以数据驱动的方式利用神经网络深度学习的算法进行模拟预测,由于神经网络算法内部为“黑盒”,对分析结果的成因解释便成为难题。
以上两种建模方法均有优缺点,有学者提出将大数据、机理模型和人工分析相结合的复杂系统数学建模方法。这种方法比较复杂,需要对具体问题结合大数据算法,对过程机理进行逐个影响因素分析,建立多个子模型,对不同子模型选取适合的模型进行分析(见图3)。
图3 复杂设备诊断问题
模型不仅需要数据作为输入,同时还需要结合模型开发技术。模型算法技术中包括知识驱动的机理模型和数据驱动的大数据模型。对于大数据模型的应用可以考虑利用开源框架(如 TensorFlow、百度飞桨等)的基础算法,并在此基础上结合业务特征。另外,对于算法和业务结合,逐步建立典型案例,需要对案例信息进行知识提炼,利用知识管理技术逐步进行知识驱动的机理模型库的建立。因此需要从平台角度考虑对算法框架、知识管理等功能的支撑。
基于以上分析,在搭建平台时需要考虑:
1)通用基础算法框架
数据驱动的大数据模型、机理模型两种建模模型方式,为了提高解决实际业务问题的效率和效果,可以在通用的、成熟的基础框架上进行业务问题算法研发。因此管道数字化平台搭建时可以考虑集成多个基础模型算法框架,为业务算法研发提供支撑。
2)建立解决业务问题的算法模型知识库
在形成大数据和机理模型后,需要及时总结业务场景及算法模型,作为案例进行信息提炼形成知识,逐步建立算法模型知识库。
应用(服务)在宏观战略层面是以管输企业的战略目标进行规划,支撑企业数字化转型。在战略目标的规划下,解决具体业务问题。业务问题的提出,需要对应层级数字孪生体的数据(包括水平主线移交数据和垂直主线实时数据)和对应问题的分析模型算法结合形成对应的应用进行支持。对于复杂业务问题需要进行分解,并且确定他们之间的关联关系。最终利用各种建模技术建立模型,输入数据,输出分析结果。
管输企业提出了本质安全、高效运营的战略目标。针对本质安全的战略目标,提出了线路本体腐蚀预测、地灾监测等业务问题。针对高效运营目标,提出了针对设备运行效率优化等业务问题。在开发应用的过程中参考相应阶段,结合数据与模型分析解决业务问题,梳理、明确数字孪生体应用场景以及应用功能设计。并利用分析结果对实际物理实体进行优化,从而实现数字孪生体的业务价值。逐步完善多层级、多种组合关系的孪生应用,最终形成孪生业务生态。
基于以上分析,在搭建平台时需要考虑:
1)应用统一规划,逐步开发实施
从业务角度对应用进行整体规划,按照企业战略目标进行业务问题的优先级划分,整合后台数据,按照优先级进行业务问题研究及模型建立,逐步进行应用的开发和实施。
2)业务应用具备敏捷开发模式,快速响应业务问题
业务问题是按照企业战略目标和优先级进行解决,根据不同的业务问题进行逐步建模分析处理。同时对应的业务应用也是逐步建立,并随着战略目标的变化进行维护更新。需要平台具备敏捷开发模式迭代更新的能力,进行快速发布部署,最终达到与业务需求相匹配的应用模式。
通过对数字孪生体技术发展趋势分析,对数字孪生体概念理解提出平台设计思路,在此基础上提出功能框架,主要包括:数据、模型、应用(服务)。
数据主要功能:数据标准管理、数据质量控制、多源数据集成、多阶段数据整合与管理、数据服务。
模型主要功能:通用算法框架(数据驱动的大数据模型、知识驱动的机理模型)、模型算法知识库、模型算法服务。
应用(服务)按照企业总体的战略目标规划应用,总体分为线路管理应用、生产运行管理应用、设备管理应用。然后根据业务问题逐步确定具体应用,是一个循序渐进逐步积累的过程,最终形成数字孪生体应用生态(如图4)。
图4 孪生平台功能框架
数字孪生体平台的搭建,需要充分利用信息化新技术的支持,包括:物联网、大数据、人工智能、知识图谱等技术。
首先,数字孪生体的映射需要以数据为基础。数据涉及到集成、存储、处理等技术。集成涉及到多类型数据源,主要包括:信息系统接口、历史文件导入、物联网消息、自控系统接口、各种数据库对接等。对于管道数据的集成主要考虑设计成果、工程建设采集数据、线路监测数据、SCADA采集数据、生产运行设备等管理数据。存储涉及分布式文件存储、分布式结构化数据存储、分布式列示数据存储和分布式图数据存储等存储技术[16]。处理涉及到批处理、流处理、图计算、内存计算、批流混合计算等技术[17]。
其次,数字孪生体场景的实现需要发挥模型的核心作用。模型涉及到数据驱动的人工智能算法和知识驱动的机理算法。人工智能算法主要包括:回归与分类、聚类、协同过滤、降维、频繁模式挖掘和神经网络等人工智能算法模型[17]。机理算法主要包括:流体动力学机理、质量守恒、能量守恒、动量守恒、物性状态方程等。除了模型之外还需要进行知识工程的建设,涉及知识表示、知识获取、知识推理、知识集成和知识存储等关键技术。
最后,数字孪生体场景的应用是将数据和模型结合进行功能实现解决问题的载体。由于管道业务特点,针对具体业务问题是逐步发现,并建立数据和模型的数字孪生体场景应用。因此在技术支持方面,需要有敏捷开发、微服务等框架的支持,保证对数字孪生体场景的应用生命周期管理(如图 5)。
图5 孪生平台技术框架
本文针对长输管道管网、管线、站场、设备实体进行数字孪生关系分析,提出长输管道的水平数字主线和垂直数字主线,在通用智能分析算法框架上搭建管道专业算法并逐步建立算法模型知识库,应用统一规划逐步开发实施快速响应业务问题的平台思路。当前,在数据、模型、应用(服务)仍存在需要进一步研究的方向:
一是数据需要进一步细化。长输管道行业对于数字孪生体实体层级的划分需要进一步细化明确。各种数字孪生体之间的关系在基础类型的会有具体变化。对应数据分类、属性、采集项的明确工作更为艰巨,需要业务专家和管理专家支持协调。并且对于物理实体的数据采集工作,也涉及到采集成本、网络传输等诸多技术问题需要解决。
二是模型需要针对业务建立,逐步积累知识库。由于长输管道线性长距离分布,同一业务问题在不同地区的影响因素不同,从而分析模型和算法的建立会产生差异,因此模型建立需要考虑多种方式不同影响因素,并进行评估。另外逐步形成一个企业级模型知识库,对已有经验进行积累,是一个漫长的过程。
三是应用(服务)需要以数字孪生体为中心结合管道数据与模型,快速响应业务。虽然现阶段有各种建模技术,但针对具体应用场景的落地,需要大量工作。模型知识的积累方面,虽然知识图谱技术已广泛应用,但并不能生搬硬套到工业模型上。因此,对于管道数字化平台搭建的重点是以管道实体为中心,从业务问题与孪生场景对应的数据整理、模型研发、应用搭建三方面考虑,最终形成对管道运行的优化方案,作用在物理实体上。
综上所述,目前的数字孪生驱动管道数字化平台建设还有诸多研究课题亟需探索,且有巨大的应用前景,本文按照数据、模型、应用(服务)提出了管道数字化平台的功能框架及技术框架,为管输数字化平台搭建提供参考与借鉴。