石 硕,郭保琪,冷君阁,林喜军
(中国海洋大学 信息科学与工程学部,青岛 266100)
数控机床产业具有产业链长、技术要求高的特点,属于资金技术密集型产业。数控机床是云南省的传统优势产业和重要支柱产业,经过近90年的发展,高效精密数控机床产业作为云南省重点发展的产业集群已形成规模集聚、生态链完整的产业体系,拥有加工中心、镗床、铣床、车床、磨床等金属切削机床完整系列的产品体系[1],形成了研究、设计、开发、制造、服务、教育等较为完整的产业能力,已成为知名的高效精密机床制造基地。数控机床产业关联度高,区域产业集群效应对经济发展的支撑和带动作用大,大力发展中高端数控机床产业,对加快培育云南省新的经济增长点,促进产业结构调整,建设工业强省具有重要意义。
目前,在集聚区域实现产业集群的协同发展已成为云南制造行业的典型发展模式,加强中高端数控机床产业链协同制造,促进大中小型企业协同发展已成当务之急。区域发展中高端数控机床产业集群,需要率先引进规模大、实力强、带动作用明显的龙头企业,再通过产业链条延伸,带动区域中小配套企业发展,从而有效地促进数控机床产业的集聚发展[2]。在发展过程中,面向机床产业链及关联产业的企业,充分考虑设计、生产、质量、物流、销售、服务等多种因素,围绕企业在生产制造、供应链、企业管理的核心需求,构建面向数控机床产业集聚区域的网络协同制造服务平台,开展区域数控机床产业链制造技术、资源能力和服务的协同,形成敏捷、精益、高效的经营、设计和生产的数控机床产业集聚区域,实现区域的高效统筹、优化、调度、品控和高效率协作,带动区域数控机床产业高质量发展。
数控机床产业集聚区域网络协同制造大数据平台是网络协同制造服务平台的重要支撑,主要用于提供数据汇集、数据协同、数据处理、数据分析等大数据服务。本文在研究剖析数控机床产业集聚区域网络协同制造过程中大数据分析现状及需求的基础上,重点开展区域网络协同制造大数据平台开发及部署基础研究工作,设计平台的总体架构及架构中工程管理、样本管理、建模管理、应用管理和知识管理所涉及的关键点,建立面向多种应用的大数据中心,实现区域数控机床产业链上企业间研发、管理、应用的数据协同和业务协同。
当前,全球主要国家掀起了新一轮以“信息技术与制造业融合”为共同特征的工业革命,加速发展大数据、人工智能等新一代信息技术,并推动其与全球工业系统的深入融合,以期抢占新一轮产业竞争的制高点。无论是欧美发达国家制造业的重振,还是我国制造业的转型提升,工业大数据都发挥了不可替代的作用。工业大数据的创新发展,成为未来提升制造业生产力和竞争力的关键要素,是目前全球工业转型面临的重大课题[3]。
网络协同制造是工业大数据的载体和产生来源,其各环节信息化、自动化系统所产生的数据构成了工业大数据的主体,网络协同制造又是工业大数据形成数据产品的最终应用场景和目标。在数控机床产业集聚区域网络协同制造过程中,从向制造商下订单到生产制造并交付给客户,整个产品生命周期产生海量数据,包括:上游的数控系统、核心零部件、功能部件以及电子元件等运作所需设备及部件的数据;中游数控机床主机厂的金属切削机床、金属成型机床、特种加工机床等机床和数控系统产生的数据[4],这是网络协同制造过程中数据的重要来源;下游数控机床应用方面,主要是汽车、航空航天、模具和工程机械等行业的应用数据。
网络协同制造大数据平台是建设和实施大数据应用所必需的基础设施,也是突破当前技术瓶颈的有效突破口。建设网络协同制造大数据平台有助于不断汇聚大数据技术创新成果,积淀丰富的数字资产,形成大数据技术产品和行业解决方案,加速我国大数据产业生态构建,提升我国数字化发展水平。本章节重点开展数控机床产业集聚区域网络协同制造大数据平台的需求分析研究。
数控机床的属性、加工和测量数据通过各种传感器和测量装置来采集,属性数据是机床、刀具和工件的物理数据,包括切削刀具的制造商、制造日期和工具类型,机床的制造商和机器类型等;加工数据是机床在加工过程中实时产生的数据,如切削力、应变场和温度场,可反映加工过程的实际状态;测量数据可以反映加工性能的测量结果,如工件的几何精度和表面粗糙度、刀具的磨损数据等[5]。在数控机床上游企业及主机厂和外协厂的跨企业、跨区域、跨组织协同制造过程中,大部分机器运行在隔离环境中,且机床的制造商、品牌和类型各不相同,从生产现场到管理端的所有生产、交换和集成数据存在信息孤岛,缺乏统一的数据接入与访问规范。此外,面向企业级应用的ERP、PDM等软件,主要用于对静态数据进行管理,缺乏动态及实时的数据处理,难以实现数控机床产品全生命周期的数据协同、信息协同和知识协同[6]。
亟需开展网络协同制造大数据平台的协同应用研究,通过传感器和标准通信接口,感知和获取机床状态和加工过程数据[7],通过数据协同,有效保存机床数据,形成机床数据库;通过信息协同,实时动态获取机床加工状态,初步调整机床参数;通过知识协同,建立机床模型,研究机床参数间的相关性,实现机床运行参数的精准调整。
数控机床制造大数据来自于机床不同的功能部件(如控制器、伺服系统、丝杠等)[8],由于数控机床制造车间、机器性能指标多样、生产方式多变、随机扰动频繁、生产环境开放等特点,除进料、温度、速度等简单物理量外,其他原始数据均具有高维、异构、多尺度、低密度、不确定、高噪声等特点,无法直接提供给终端用户或系统使用,此外,数控车间系统数据库也存在数据缺失、重复、错误等问题。因此,需对机床工业大数据进行数据去噪、数据清洗、数据集成等预处理操作。
从机器收集的运行数据是实时和海量的,通用关系数据库和传统方法无法有效处理数据。如何进行有效的数据缩减、提取、分析和变换处理,是将繁杂数据转化为有用制造信息的必要步骤[9]。亟需开展网络协同制造大数据平台的数据处理技术研究,为后续数据分析工作提供高质量数据。
为动态了解机床的结构、运行状态及加工信息(如机器状态、主轴状态、刀具状态、表面质量等),提高机床生产效率,需对预处理后的机床数据进行大数据分析,以获取几何约束、切削力、切削层、刀具强度、高温材料、摩擦学及化学过程等相关加工元素之间的关系[10-11]。
亟需开展网络协同制造大数据平台的数据分析研究,根据大数据分析需求,设计分析模型,通过建模分析和数据挖掘对加工过程进行学习,不断修正和调整数据和模型,训练出精准的优化模型和算法来动态获取机床的切削深度、进给速度和主轴速度,预测精密车削中与振动和表面粗糙度有关的润滑状态等信息。算法输出的决策信息通过逻辑控制模块控制机床的CNC控制器,CNC控制器调整机器参数以实现机床的快速响应和闭环反馈控制。数据分析可以形成支持最优决策的信息和指令,实时掌握机床加工状态,动态调整机床的运行和加工参数,实现对机床及加工过程的监测、预测、决策和控制,满足高效、柔性、自适应、智能化的加工需求[5]。
数控机床产业集聚区域网络协同制造大数据平台在现有工业大数据平台基础上进行延伸发展,覆盖供应链管理、质量管控、物流管理、设备智能管控等数控机床行业业务需求,汇聚制造小数据而形成的工业大数据,支持跨域制造资源与需求高效对接、全过程一体化组织生产模式、多企业协同优化控制、全生产链信息追溯服务等协同场景。
本文在分析数控机床产业集聚区域网络协同制造平台在数据/信息/知识协同、数据处理和数据分析等需求的基础上,提出以网络协同制造智能应用研发为重点,以大数据分析建模为核心,“统一管理、优化迭代、整合资源、协同共享”的设计思路,构建功能模块包括工程管理、样本管理、建模管理、应用管理和知识管理的网络协同制造大数据平台架构,支持大数据平台的低代码快速开发,全面提升区域数控机床产业在网络协同制造项目管理、研发、应用方面的能力。
参考业界主流[12-13]及钢铁、纺织等行业[14-15]的网络协同制造大数据平台体系架构,本文研究了具有数据管理、数据交换优化、统一模块接口规范的数控机床产业集聚区域网络协同制造大数据平台架构,依托大数据、人工智能等新兴技术,支持构建高效、精准、实时的区域网络协同制造大数据平台,通过可视化操作界面、具象化算法结果、拖拽式任务流、可灵活自定义特性,及内置丰富模型算法与案例,实现对各种数据源、组件、算法、模型和评估模块的组合应用,使缺乏数控机床行业模型构建能力的人员能在其之上通过简单的学习进行模型训练、评估和预测,解决各种跨时空跨领域生产、跨企业跨价值链高效协同、资源优化配置等场景问题。平台总体架构设计方案如下图所示,包括工程管理、样本管理、建模管理、应用管理和知识管理五大功能模块。
图1 数控机床产业集聚区域网络协同制造大数据平台总体架构
针对数控机床协同制造过程多源异构复杂环境中的数据样本、建模流程管理与模型追溯等问题,设计平台项目的运维管理和样本资源管理,提供数据的业务管理功能和样本处理工具集,对工程整体的横向流程和纵向概况有全方位的诠释和管理;对样本资源的结构、分布等进行分析和诠释,通过可视化界面使用工具集对其进行数据处理,从而实现平台工程全生命周期管理。工程和样本管理功能主要由工程管理和样本管理模块组成。
3.1.1 工程管理模块
工程管理模块对平台上深度学习、机器学习任务进程进行监控和管理,对项目的数据接入、通用hub接口、数据处理、模型训练、包装应用的整个生命周期进行管理,支持实时可视化展示任务状态和资源状态,并记录建模过程各环节详细日志,包括接口管理、流程管理、迭代管理、权限管理、可视化展示、分析统计、安全管理7个子模块。
1)接口管理
平台通过统一的通用hub接口接入数控机床协同制造过程源数据,用文件传输或消息中间件实现来自不同数据源的传输异步操作。数据采集过程的吞吐量远远高于大数据平台的处理能力,异步数据传输可以在大数据平台和不同的数据源之间进行解耦。平台架构支持其进行动态伸缩,如果数据是直接从外部数据库中抽取,拉取数据使用批量方式,如果数据是从文件解析,则使用相应的解析器。
2)流程管理
流程管理具备完整的工程管理流程和建模管理流程,一个典型流程共包含“将工程数据从本地上传到服务器、对工程数据做预处理、将预处理后的数据切分成训练集和测试集、训练预测模型、将验证数据从本地上传到服务器、对验证数据做预处理、在验证数据集上验证预测模型、生成模型评估结果”8个环节。
3)迭代管理
迭代管理反映了整个的建模过程与追溯、建模方案的比较和建模方案的多种选择等,用于管理建模周期内的源数据、模型和应用等对象产生和变化的整个过程。从开始导入样本数据到最后形成应用,每个版本会经历若干个阶段,因此,在工作流程管理中,每一个版本都会分别对应某一个工作状态、不同状态的版本具有不同的使用控制权限。在区域网络协同制造大数据平台中,无需人工干预这些状态标识,开发人员在开发新模型过程中,上传新的样本集、保存新的模型时,都会自动记录操作信息。工作版本的权限可根据需要进行修改,每个工作版本都保存在工作区中,工作版本记录了设计人员对产品的每次修改,便于开发人员随时跟踪任何一次修改的状态。
4)权限管理
权限管理提供了项目管理员、编辑者、阅览者3种默认角色,以方便管理员进行快速设置。项目管理员拥有对该项目中所有资源的编辑权限,并且可以修改项目名称和描述,添加或删除项目管理员,创建、修改、删除角色,添加、删除用户及赋予用户角色等;编辑者拥有对该项目中所有资源的编辑权限;阅览者拥有对该项目中所有资源的查看权限。
5)可视化展示
将结构化或非结构化数据转换成适当的可视化图表,将隐藏在数据中的信息直观地展现给用户。数据可视化模块底层与区域网络协同制造大数据平台对接,上层与数控机床的业务模型算法对接,通过拖拽的形式将数据与图表进行绑定,快速实现数据可视化。图表类型包括柱状图、折线图、柱线图、区域图、散点图、饼图、地图、甘特图、卡片图、气泡图、树形图、透视表、突出显示表、多透视表、多度量图、区域地图、帕累托图、热力图、仪表图、漏斗图、雷达图等。
6)分析统计
大数据平台支持多种数据库、数据文件的集成解决方案,提供在线数据筛选、统计、分析功能,基于图表数据进行自动分析,生成分析结论。
7)安全管理
大数据平台具有安全性和稳定性。一方面,在架构设计中考虑平台中模型、算法、数据的安全控制方案,有效防止模型、算法、数据的非法访问和下载,防止数据泄露。另一方面,系统可对后台异常按严重程度分级,不严重的异常后台自动重新运行,严重的异常及时抛出到前台告知用户,对于一些常见的抛出异常(如空间不足、路径不存在等),在抛出时会转换成用户易理解的错误信息。此外,用户还可通过可视化控制台查看任务日志。
3.1.2 样本管理模块
样本管理模块包括样本分析和样本处理。样本分析是通过平台可视化图表和分析功能,对项目所有样本源数据从样本来源、样本类型、样本属性、样本质量、样本结构5个角度进行分析,对样本进行多维解析呈现和深度理解;样本处理是通过统一的通用hub接口接入源数据,利用大数据平台提供的一系列样本处理工具集,进行样本去噪、标定、增广、优化、格式转换等初步操作,对特定样本数据进行筛选、帧提取等处理,形成标准化的平台规范样本数据。
大数据分析功能是大数据平台架构的核心功能,对接入平台的样本数据进行建模分析,输出分析结果与模型,对数控机床加工过程进行监测、预测和控制;提供算法库、知识库、可视化建模等一系列工具集,为分析建模提供辅助与支持;制定包括接口、数据格式、模块组合等标准规范,增强大数据平台的可扩展性;采用知识管理技术,积累算法和模型,形成数控机床知识空间,实现知识的发现、集成、协同与应用。大数据分析功能主要由建模管理、知识空间和应用管理模块组成。
3.2.1 建模管理模块
建模管理模块对平台大数据分析建模进行管理,建立建模流程,对操作人员的模型建立流程进行规范与行为指导,保证模型快速、有效建立;建立开放式组件库,对算法组件进行封装,建立模型时可通过拖拽等方式实现模型的快速建立;提供并行分布式训练引擎,支持有监督、无监督等多种模型训练方式;制定相应标准规范,对接入平台的数据、模型接口、组件接口等进行规范化设定,保证建模过程标准有效。
1)建模流程
制定数据分析建模流程,规范建模过程,将整个建模过程分为算法选择、模型设计、系统仿真、模型训练、模型预测五个步骤。
算法选择:根据大数据分析需求选择相应算法,算法来源主要包括开放式组件库以及知识空间中的算法库。当需要的算法不足以支撑分析需求时,可自行进行算法的导入或由提供商进行算法的生成。
模型设计:根据大数据分析需求进行分析模型的设计,系统提供可视化的工业模型装配线,设计人员可根据需要进行算法组合。若分析案例与平台前期分析过的案例相符合,设计人员可直接从开放式模型库中选择相应模型进行建模。
系统仿真:完成所有环节的模型设计后,建立动态仿真引擎,实现仿真运行、仿真分析等功能,通过系统仿真对系统模型进行动态验证,计算所有模型的仿真输出,并与实采数据比较。
模型训练:从并行分布式训练引擎中选择相应训练模式,由训练引擎统一调度服务器资源,使用样本空间中的训练数据进行模型训练。
模型预测:使用样本空间中的验证数据进行模型分析结果验证,并对模型进行优化,使用样本空间中的测试数据进行分析结果预测。
2)标准规范
在建模管理模块中提出整个大数据分析活动的标准和规范,对大数据平台内的模型接口、组件接口、数据交换、模块加入等行为进行标准化的定义,并制定相应的标准规范。
模型接口规范:为大数据平台生成数据分析模型制定标准,包括数据集输入方式、分析结果输出方式、参数调整、功能描述、发布标准等。
组件接口规范:为接入大数据平台的相关组件(如算法组件)制定标准,明确输入、输出、参数设定以及功能描述等。
数据交换标准:为大数据分析过程中的数据交换制定标准,如样本数据接入格式、中间过程数据展现形式、分析结果的输出格式等。
模块加入标准:面向工业模型装配线,制定模块加入标准,为模型装配提供相应的标准和指导,避免在模型设计中出现不符合逻辑的情况,使模型设计快速、准确进行。
3)开放式组件库
大数据平台提供开放式组件库,主要包括深度神经网络算法组件以及特定的功能组件两大类。其中深度神经网络算法组件包括卷积器、池化器、激活函数等基础算法组件,还包括Inception模型、Res模型等相应的算法模型。功能组件即算法组件能够实现的相应功能,如神经元功能可视化、特征分布计算、图像频谱分析等。
4)并行分布式训练引擎
并行分布式训练引擎面向并行及分布式计算,为大数据分析提供多种训练方式以及分布式服务器资源的统一调度,使分析模型能够充分利用资源,提高大数据分析效率。
5)工业模型装配线
针对数控机床产业上下游企业开展工业大数据应用时所面临的智能技术壁垒、建模工具缺乏等问题,大数据平台提供工业模型装配线功能,可以根据大数据分析项目需要,进行场景驱动的工业大数据智能模型可视化建模,制定模型库接口规范,通过工业模型装配线进行模型的在线装配设计,可以从平台开放式组件库选择深度神经网络算法组件或功能组件,也可以使用知识空间中的算法库或从开放式模型库中已有的算法模型中进行选择,实现可视化拖拽及低代码嵌入方式快速构建智能模型。
3.2.2 知识管理模块
大数据平台采用知识管理技术对平台产生成果进行研究,通过知识发现、知识集成、知识协同、知识应用等一系列技术手段,生成知识空间。知识空间主要包含开放式模型库、算法库、算法框架、理论/标准/规范、标定数据库、图像储备库、分析与评价数据等。
1)开放式模型库
开放式模型库用于管理大数据平台生成或导入的分析模型,可以为模型设计提供支持与辅助,提高建模效率。从功能划分上看,主要分为两类,一类是单一功能的分析模型,如回归模型、分类模型、关联分析、序列分析、概率决策、分布拟合等;另一类是完整功能的分析模型,如图像识别模型库、系统辨识模型库、自动控制模型库。
单一功能的分析模型一般由平台系统导入,开发人员按照平台标准规范要求,对已有的或来自互联网的算法进行修改后,通过相应接口导入模型库,同时也支持开发人员通过平台生成相应模型。完整功能的分析模型支持导入互联网上已有的较为成熟的专用分析模型,需按照标准对算法进行修改与完善。开发人员使用平台建模功能,通过验证发布的模型也是此类分析模型的重要来源。
2)算法库
知识空间提供一个基础的通用算法库,集成已有的分析算法包括浅层学习和深度学习算法,开发人员不必进行基础算法编程,专注于模型设计。算法库中的算法符合平台标准规范,提供标准接口可由开发人员或者系统研发人员进行算法的导入。
3)算法框架
按照平台标准规范,集成已有的深度学习分析框架。系统默认支持google开源框架TensorFlow、facebook框架Torch、Caffe、paddle等,可以通过统一标准接口进行调用。
4)理论/标准/规范
大数据平台提供高维状态空间、自适应行为变化、连续动作空间等复杂环境下的深度学习理论方法,提供深度强化学习标准规范。
5)标定数据库
大数据平台对标定数据进行维护生成标定数据库,主要包括专用标定数据和公共标定数据,通过平台运行使用逐步丰富完善标定数据库,为后续数据标定提供辅助与支持。
6)图像储备库
大数据平台对图像及标签进行存储,对图像分级类别进行描述,生成图像储备库,便于后续进行图像分类检索。
3.2.3 应用管理模块
应用管理模块是大数据平台的结果输出接口,对数控机床协同制造、工业控制、状态预测等方面应用的大数据分析结果进行输出,包括数控机床模型的发布、分析算法的嵌入式移植、运行过程监控以及性能/根因/健康分析等。
1)发布管理
平台大数据分析建模完成后,可以将模型进行发布,发布的模型存储到知识空间的开放式模型库中,结合平台系统的工程管理模块,对模型的功能、模型的组成结构、产生过程等进行描述,为后续相同或相近项目提供辅助支持。
2)运行监控
大数据平台提供运行监控功能,对分析模型进行实时监控,提供可视化输出接口,实时显示数据分析的过程。运行监控支持对数控机床工业现场设备数据及分析过程的实时监控。
3)嵌入式移植
大数据平台使用Python进行编程,具有较好的可以移植性。针对某些需要进行实时数据分析的场景,通过平台建模生成相应模型,将模型进行压缩并导入作业现场的设备中,对设备采集到的数据进行实时分析,并将数据及分析结果返回到平台。
4)性能/根因/健康分析
执行性能/根因/健康分析操作,并对分析结果进行格式化输出,生成分析报告。
本文通过剖析数控机床网络协同制造大数据平台建设过程中,对于数据汇集、数据协同、数据处理、数据分析等大数据技术的应用需求,从工程管理、样本管理、建模管理、应用管理和知识管理五个方面设计大数据平台的具体功能实现,建立面向数控机床产业集聚区域的网络协同制造大数据平台整体架构,为网络协同制造服务平台提供大数据使能技术支撑,为学术界和数控机床产业界提供大数据平台架构参考。