基于“数据+知识”双中台的企业数字孪生探究

2021-11-07 19:44金剑锋
科技信息·学术版 2021年22期
关键词:智能化

摘要:“十四五”海关发展规划是海关未来五年发展的战略规划,通观全文,全领域覆盖、全链条监管、全面提升智能化是高质量发展的新要求。以发展规划为纲,结合作业中心在加贸领域的企业画像探索,笔者提出企业画像的智能路径研究,即构建以“大数据+知识图谱”为基础的“数据+知识”中台,以双中台为基础构建企业数字孪生模式,打通从数据到知识再到智慧的通道。在新发展阶段,以新发展理念,展现海关改革强关、科技兴关的责任与担当。

关键词:智能化 双中台 数字孪生 企业画像

一、以发展规划为纲,全面提升智能化

“十四五”海关发展规划是海关未来五年发展的战略规划,是我们未来的行动纲领,通观全篇,高质量监管与服务离不开科技引领与支撑,未来的五年,将是海关全面提升智能化水平的五年,是全面促进业务科技融合的五年,是全面践行改革强关、科技兴关的五年。在新发展阶段,以新发展理念,进一步服务经济发展总体格局,充分展现海关新的使命担当。在这一总体框架设计下,以“三智”核心精神为引领,在加工贸易领域加快创新实践,进一步深化专业化审核等特色工作,进一步提升作业中心对关区加贸企业智能监管与服务水平,通过构建以“数据+知识”双中台引擎,对关区加工贸易企业进行画像,对未来进行展望,通过推进建设企业数字孪生全面提升加工贸易领域的智能化水平。

(一)迎接业务规范化挑战,构建加贸业务指标体系。

根据规划(二十七)完善海关技术规范和业务规范体系。

在未来五年内建立全国海关统一的业务指标体系,完善统一的数据规范体系,优化支撑性业务规范,遵循国家和国际有关标准规范,构建适用于全链条监管的统一技术规范,提升信息数据交换水平等要求。

笔者认为,全面智能化的基础必定是业务指标规范统一,业务指标规范统一需要各业务部门在统一目标下、统一领导下,齐心协力才有可能构建成功。作业中心通过在加工贸易领域进行企业画像,以多种途径收集和分析企业基本资料、运行管理、关联关系、监管评价等信息,开发数据集成功能,按一定的分析框架形成统一的指标体系,通过对风险模型建设及调优做到对企业的精准监管与服务,达到“业务指标系统化、风险分析模型化”。

(二)迎接业务智能化挑战,构建加贸业务智能体系。

规划中17次出现“信息化”、30次出现“大数据”、51次出现“智能”,可见,全面提升智能水平是海关各业务领域根本需求,是探索全业务领域高质量发展、全链条智能监管的根本途径;同时根据规划(三十四)增强海关信息化支撑能力、(三十五)深化海关大数据应用,完善信息化基础、构建从数据到知识再到智慧的通道都是实现业务智能化的挑战。

作业中心以线上大数据画像、线下专业化审核构建闭环,做到对关区加工贸易企业、行业格局发展心中有素,进一步提升业务监管智能化水平,进一步提升监管效能、严守风险防控底线,从而更好地加强对企业的服务支持与风险防控,为在下一阶段全面提升智能化打好基础,达到“业务监管智能化、风险判别精准化”。

(三)迎接人才培养挑战,构建加贸综合人才培养体系。

根据规划(四十五)加强人才队伍建设中大力实施人才强关,以优化人才结构为重点,强化人才在科技创新中的主体地位,持续优化人才发展环境和成长路径,可见,人才培养是我们干事创业的基础,全面提升业务智能化,一定要培养业务科技一体化人才。

作业中心通过业务与科技相融合的企业画像,通过专业化审核、结合数据分析,我们为下一阶段创新改革工作打好专业化、综合化的人才坚实基础,为队伍发展培养科技业务融合的综合性人才,达到“创新工作常态化、人才培养综合化”。

二、以双中台为引擎,塑造智慧新平台

“十四五”规划(三十五)深化海关大数据应用中提到“完善大数据基础设施,汇聚多形态数据资源,形成海关大数据湖,为海关数据治理提供基础支撑。构筑集专家经验与业务知识为一体的知识计算新引擎,建设海关特色知识图谱,打通从数据到知识再到智慧的能力提升通道。”这将进一步推动“大数据+知识图谱”在海关中的理论及应用探索,笔者认为基于这一理念建设“数据+知识”双中台,能够进一步提升海关大数据治理能力,为全面提升智能化打下平台基础。

(一)从数字化到智能化,重塑信息化格局

海关历来重视信息化建设,从H883、H2000到H2010再到H2018、金关二期建设,积累了大量信息化建设经验,但是传统的信息化系统多以流程和管控作为任务目标,缺少智能化的技术手段,无法有效处理和应对信息与知识的爆发,主要体现在①对一线执法的智慧决策及辅助仍显不足,海关在北京、上海、广东等地建设了多个大数据中心,目前来看,中心的计算能力仍無法被充分使用,还不能够在全业务领域形成智能决策方案,业务一线得到智能决策支持仍不足;②数据形态越来越复杂,金关二期在全国各地海关建设了各级监控指挥中心,收集了大量的音视频数据,多形态的数据越来越复杂,传统的数据处理方式已经无法满足需求,急需借助智能化技术和应用的帮助;③全链条的数据联通仍显不足,人机智慧交互仍显不够,在海关各系统之间业务链条、数据链条还不够通畅,在业务人员与业务系统交互方面,系统仍然显得不够“聪明”,业务专家知识无法有效地被系统理解利用,数据与业务场景结合不够紧密,上述因素都阻碍着海关监管与服务的高水平发展,都需要通过进一步提升智能化水平来解决,最终打通从数据到知识再到智慧通道。

中台的作用在于打通固有多业务系统之间的数据壁垒,融合各个不同业务系统间所产生的数据,通过数字化驱动支撑前端业务的快速变化,从而产生更大的价值。随着数据中台之后,以知识图谱、人工智能技术为代表的知识中台作为新经济形态下的智能化方案,将持续从技术、行业应用、生态合作的角度进行提升,更好地赋能和提升海关创新能力和治理水平。技术方面,知识中台的数据处理能力将由结构类、文档类数据,拓展至图片、音频、视频在内的多模态数据;通过图谱技术,知识中台将提升复杂知识表示和快速构建技术,提升数据知识化的效率。应用方面,知识中台将由搜索、问答、推荐,升级至辅助决策、预测、推理等各类业务场景的知识深度应用,满足海关各业务领域自动化定制需求,提升各业务领域智能化水平。

同时,笔者认为知识中台可以理清海关全业务领域逻辑,用机器可以理解的方式将知识组织起来,从而建立符合总体需求的智能化应用,全面提升智能化水平,重塑信息化发展格局。推动作用体现在①为各业务领域快速提供定制类智能化服务,助力业务智能化水平提升。从“十四五”规划整体来看,各业务领域都有对智能化的要求,构建统一的知识中台,将共性的智能化分析以服务形式提供,能够以较低的成本,自动化提供定制服务,满足更多业务领域内需求,助力监管与服务;②各业务领域利用和反馈中台,使中台能够提供更具业务价值的洞察,有效支撑各级业务人员决策,降低执法风险,提升服务效率,使得人民满意,践行“人民海关为人民”;③在知识中台的智能技术支撑下,各业务领域能够积极推动业务模式创新,及时得到改革效果反馈,进一步推动改革强关,知识中台建设将成为推动创新成功、人民满意的核心驱动力。

(二)从数据中台到知识中台,打通数据到知识再到智慧通道。

1、知识中台架构体系。

数据中台理解为数据大脑,这个数据大脑主要是用技术链接计算平台的数据处理能力,来负责对数据进行收集、分析、下发、整理等一系列的工作。因此,数据中台不但要将很复杂的大数据处理技术封装起来,形成计算平台;同时进入数据中台的数据都需按照规范的建模方法论将数据形成主题域模型、形成标签模型或者算法模型,这类数据模型就是数据中台的核心。

知识中台在架构中处于承上启下地位,包括三个层面:基础技术、核心功能、产品矩阵。其中,基础技术层提供以人工智能为核心的技术支持,主要包括知识图谱、自然语言处理、多模态数据(结构化数据、音视频等非结构化数据)的综合处理及分析;核心功能层涵盖知识生产、知识组织、知识应用的全流程;产品矩阵层封装了平台、应用、行业解决方案多层级产品,为各行业、各类场景提供全方位服务。面向智能化升级需求,知识中台可以提供灵活、多样的服务方式,包括标准化产品服务、组件化服务能力输出、集成解决方案构建,和定制服务的设计与实施。

2、引入知识中台解决传统企业画像工程实践三大问题。

(1)数据问题——数据治理的问题。

从加工贸易领域企业画像工程实践分析,所需信息包括行业地位、生产经营、商品信息、加贸业务、监管记录、风险行为六个维度,①行业地位,产业链情况、是否为上市公司、当前海关认证等级、企业信用情况、企业投资额、企业进出口金额企业人数等;②生产经营,逾期手册企业、剩余料件比例、结转比例、内销比例、有进口无出口、首办企业、半年未进出口企业、进出口倒挂等;③商品信息,企业主要进出口商品,企业生产工艺,企业单耗分析,有无超配额、禁止类、固废、风险类等商品信息等;④加贸业务,加工贸易增幅、加工贸易降幅、手账册办理有无违规情况等;⑤监管记录,企业稽核查记录,涉案情况,第三方盘库等信息;⑥风险记录,对企业风险行为进行记录,及企业司法诉讼、行政处罚、政策法规、监管问询等等。

以上这些数据基本来源于海关业务数据、外部工商数据、行业数据、政府公开数据以及其他来源数据,可以说是真正的多源异构,如何将这些信息有效的关联起来本身是一项非常有挑战的工作,急需数据标准、业务标准的统一,工程落地难!

(2)业务问题——知识转化与沉淀的问题

传统企业画像有待解决的业务问题主要体现在大数据与业务监管分析之间的鸿沟。以企业供应链分析为例,我们可以从海关业务数据中获取到部分供应链上下游数据,经过加工处理,形成供应链图谱。但业务领域对以供应链为单元的监管显然有更明确要求和目标,简单的供应链路无法满足业务监管的要求,我们需要按照业务场景来定制处理。这就带来了企业画像的一个业务难题,就是什么样的标签和关联分析是符合以供应链为单元这种业务场景需求的?这不仅仅是大数据处理的问题,也涉及到大量的业务领域专业知识,所以,企业画像是很有必要引入专家经验、人机协同,专家如何将业务知识落地沉淀到画像系统,都是画像系统要解决的问题。

(3)技术问题——算法模型的天花板

企业画像因为没有更全面的外部数据及企业财务、管理行为数据的支撑,所以画像标签面临不完整、不准确的问题。标签不完整是源于很多我们目前数据来源还是非常有限,那么我们定义的画像各种数据维度缺乏数据支撑,传统打标平台无法解决这块信息的补全。标签的不准确表现为缺乏背景知识的语义理解不准确,举个例子,如果某篇资讯通篇在提光缆、通信设备、基站以及车联网相关的话题,那么我们在给与上述实体标签基础上,最应该打上还有个“5G“标签,即便文章中并未提到5g,但事实上,文章内容是对5g产业链的一个综合性描述,而系统如何知道5g跟那些关键词的对应关系的呢?这就需要赋予系统一个5g产业链的背景知识。很显然,单纯的机器学习模型哪怕是预测模型也是解决不了这类标签准确性问题的。

对于一份数据稀疏的大数据,用传统机器学习方法打标,很快还会遇到一个算法的天花板。工程界算法和调参基本处在同一个起跑线,语料是决定算法结果质量的关键,企业画像数据過于稀疏、数据价值密度低,使得从显性数据里获取的语料非常有限,但我们知道在显性数据背后还有很多隐性数据关联,类似实控人这类标签业务,就是有效关联带来的成果。问题就是,如何发现这些隐性关联,以及这些关联后的新知识。

(4)引入知识图谱技术,解决三类难题。

通过引入知识图谱技术,需要在工程实践中做出思维方式的3大改变。①基于过程的分析转向基于领域的分析,这主要应对的是业务问题;②基于显性实体关系转向隐性关联关系的发现,这点主要应对的是数据问题;③基于实体关系数据的模型走向基于语义的模型,这点应对的是算法模型的天花板问题。

为了解决前述分析的企业画像系统的各种问题,我们需要引入新的“领域驱动”模式。领域分析主要在实体之间建立语义连接。我们看个具体的例子,在过程驱动中,可以将企业在产业中的信息用ER关系进行表达,于是会形成企业信息表、企业关联行业表、企业主营产品表,如果有新的数据源,比如企业供应关系,就需要增加一张表解决问题。这样一个ER关系如果转化成领域图,就是一个产业链知识图谱,这张图里有企业、行业、主营产品、供应关系、上下游等数据结构,所有数据表达采用统一的模式图”三元组“,形成的就是产业链知识图谱。面向过程的ER图的使用,需要人来找数据用数据,而面向领域的产业链知识图谱,既可以作为行业分析人员的背景知识,更重要的是,基于三元组的语义网络的数据组织形式,是可以让计算机理解产业链数据,进而可以产生机器认知的某种能力,诸如知识推理、知识补全等等,这不是面向过程的数据组织方式可以提供的能力。

我们将画像业务从基于过程的分析转变为领域分析后,需要借助知识图谱做工程落地,有了知识图谱,我们就可以利用知识推理、挖掘、发现、关联,从显性ER关系获取更多的隐性数据关联。也可以将专家逻辑跟AI逻辑做统一整合。进而,企业画像系统依赖的机器学习标签、预测标签,可以从基于ER数据的模型,走向基于语义的模型。ER模型走向语义模型我们可以有几条路径去驱动:1)特征支持,图谱的schema是特征的源,相对于实体属性关系网络特征应该是区分度最好的特征来源之一;2)语料样本数据支持,图谱的三元组数据是一个个事实,隐性关联的知识也是这样的一个个事实,从而对于标签理解或者机器学习标签可以提供语料或者样本数据;3)图分析的一整套方法可以补充进机器学习标签模型里,丰富算法空间。4)基于知识图谱的表示学习可以和深度学习结合,完成更加有挑战的标签数据的建设。

(5)构建“数据中台+知识中台”双中台驱动。

引入知识中台,建立“数据中台+知识中台”双中台驱动。体现在①从数据到信息再到知识最后到智能,数据中台主要定位在从数据到信息这个环节,知识中台定位在从信息到知识这个环节;②知识中台是知识相关、事实相关、关系相关的信息的再组织,它无法取代数据中台对应的数据中心,大多数情况下,数据中台和知识中台是共生的,他们合在一起是更加广义的数据中台。数据中台为知识中台提供大数据支撑,知识中台为数据中台赋能AI认知能力;③画像系统以及其他业务系统按需从数据中台、知识中台或者原始数据中获取数据,他们不是多选一,而是多方协作。

三、以数字孪生为基,构建智能新模式。

“十四五”规划(三十五)深化海关大数据应用中提到“探索构建与业务实体运行良性互动的数字镜像,以大数据驱动风险防控、通关监管、税收征管、检验检疫等海关主要业务运行”,这将推动数字孪生在海关中的应用探索,笔者认为基于“数据+知识”双中台实现数字孪生,能够进一步推进该智能新模式落地。

(一)以数字孪生为基础,构建业务实体数字镜像。

1、数字孪生是实体的镜中世界。

数字孪生是以数字化方式创建物理实体的虚拟实体,借助历史数据、实时数据以及算法模型等,模拟、验证、预测、控制物理实体全生命周期过程的技术手段,基于这一原理,在虚拟世界可以实现实体世界难以做到的操作,核心在试错、评估,所以在国家的十四五规划中,构建数字孪生城市对于城市治理有着巨大的提升作用,同理,构建企业、海关特殊区域等一系列的数字孪生,对于提升海关全业务领域智能化都有巨大的作用。

数字孪生模型基于多维度、实时大数据,具有如下六个特征:①互操作性,数字孪生中的物理对象和数字空间能够双向映射、动态交互和实时连接,具备以多样的数字模型映射物理实体的能力;②可扩展性,数字孪生具备集成、添加和替换数字模型的能力,能够针对多尺度、多物理、多层级的模型内容进行扩展;③实时性,数字孪生要求数字化,即以一种计算机可识别和处理的方式管理数据以对随时间轴变化的物理实体进行表征。表征的对象包括外观、状态、属性、内在机理,形成物理实体实时状态的数字虚体映射;④保真性,数字孪生的保真性指描述数字虛体模型和物理实体的接近性。要求虚体和实体不仅要保持几何结构的高度仿真,在状态、相态和时态上也要仿真;⑤闭环性,数字孪生中的数字虚体,用于描述物理实体的可视化模型和内在机理,以便于对物理实体的状态数据进行监视、分析推理、优化工艺参数和运行参数,实现决策功能,即赋予数字虚体和物理实体一个大脑。因此数字孪生具有闭环性。

2、数字孪生是虚实映射的复杂架构。

如下图,是基于双中台构建的数字孪生架构图,双中台负责基础支撑,上有数据建模与仿真分析层、共性应用层、行业应用层。

数字孪生是虚实映射的复杂架构,虚拟实体的生命周期包括起始、设计和开发、验证与确认、部署、操作与监控、重新评估和退役,物理实体的生命周期包括验证与确认、部署、操作与监控、重新评估和回收利用。值得指出的是,一是虚拟实体在全生命周期过程中与物理实体的相互作用是持续的,在虚拟实体与物理实体共存的阶段,两者应保持相互关联并相互作用。二是虚拟实体区别于物理实体的生命周期过程中,存在迭代的过程。虚拟实体在验证与确认、部署、操作与监控、重新评估等环节发生的变化,可以迭代反馈至设计和开发环节。

(二)从企业画像到数字孪生,构建智能监管新模式。

1、构建线上线下闭环,推动企业画像建设。

从加工贸易领域企业画像工程实践分析,所需信息包括行业地位、生产经营、商品信息、加贸业务、监管记录、风险行为六个维度,作业中心通过线下线下构建业务闭环,推进企业画像。

线上,通过构建企业调研及行为管理工具、商品及单耗管理工具、政策分析及检索工具、指标及标签建模工具、智能画像可视化工具、数据分析及调度工具这六个工具,对关区加工贸易企业进行画像,实现如下主要目标①业务指标系统化,业务指标体系建设是一个动态过程,按照监管作业的需要不断调整,从六个维度提取风险指标。通过对这些指标的分析计算构成评分模型,实现对企业精准画像,辅助全过程监管和服务;②行业沙盘数字化,通过可视化技术,构建加贸业务总览、行业总览、企业画像、企业集团画像、供应链画像、无感监管画像等系列数字沙盘;③企业信息可视化,从行业地位、生产经营、商品管理、加贸业务、监管记录、风险行为六个维度形成企业信息雷达图,可视化展现企业状况;④企业关系图谱化,以Neo4J图数据为知识图谱存储平台,构建如下关系图谱:企业集团关系、深加工结转、外发加工、供应链关系等,提升风险判别智能化水平。

线下,推动专业化审核,从行业中选取典型企业,从企业六个维度对企业进行调研,搭建企业智能知识库,编写调研报告书,结合线上分析对企业整体进行再分析、再提炼。

2、实现全要素数字化,推动企业数字孪生建设。

传统企业画像是站在海关监管角度上,以部分数据对企业画像,往往并不是企业全貌,数字孪生则是以企业为主体,对企业的全要素数字化,各监管部门从不同角度进行监管。从社会治理整体来看,这也是监管的大趋势。现阶段,企业数字孪生仍面临技术和非技术两大瓶颈难以突破,技术瓶颈是指当前基于云计算和互联网的聚合式的模式创新比较成功,而基于物联网、大数据、人工智能、区块链、量子通信等技术的原始创新则极度缺乏,未出现杀手级应用,各功能模块有机融合的架构未能实现,造成创新只停留在表面,企业运行和治理的水平有量的提升,但没有质的改变。非技术瓶颈,则表现在企业数字孪生整体建设是一个庞大的社会性工程,不是一个单位或部门能完成的,所需资金庞大,政府和市场边界不好划分,工程周期长投入大充满变数,企业盈利和资本回报前景模糊,观望踯躅之下,推进效果可想而知。此外,彰显智慧所必须的资源共享与业务协同机制也一直没有建立起来,信息打通仍困难,协同共治难实现。两大瓶颈悬而未决将导致推进企业数字孪生建设困难,现有的建设发展模式亟待突破。

企业数字孪生建设通过对物理世界的企业运行管理的所有要素数字化,在网络空间再造一个与之对应的“虚拟世界”,形成物理维度上的实体世界和信息维度上的数字世界同生共存、虚实交融的格局。物理世界的动态,通过多种手段采集数据,精准、实时地反馈到数字世界。数字化、网络化实现由实入虚,智能化实现由虚入实,通过虚实互动,持续迭代,实现物理世界的最佳有序运行。因为数字孪生是企业真实情况的全反应,各个监管部门能迅速提升监管与服务,实现治理智能化;同时,通过对虚拟世界的“假设”分析和虚拟规划,把握企业运行脉搏,提升风险管理水平,评估改革效果;在改革实施前就能了解企业特性、评估实施影响,避免浪费时间与资金,防止在验证阶段重新进行设计,以更少的成本、更快的速度实施改革,体现出海关十四五规划中业务实体数字镜像的巨大社会治理作用。

作者简介:金剑锋 苏州海关驻相城办事处 一级主办、副科长。

猜你喜欢
智能化
智能化的健身设备设计
500kV智能化变电站运维一体化的关键点研究
一种智能化移动学习系统的设计思考
农村电网智能化建设技术探讨
智能化仪器仪表的翻转课堂设计
智能化建筑弱电工程施工技术及验收
弱电智能化系统在建筑工程中的应用分析
成套智能化装备技术在制浆造纸行业的应用
基于Moodle平台的语文阅读教学“智能化模式”初探
基于Moodle平台的语文阅读教学“智能化模式”初探