数据挖掘技术在超精密光学制造中的应用

2014-12-18 08:04员天佑李兴兰
制造业自动化 2014年21期
关键词:知识库元件光学

员天佑,刘 金,李兴兰

(中国工程物理研究院 计算机应用研究所,绵阳 621900)

0 引言

超精密光学制造不同于传统的机械加工,产品质量受环境、设备、工艺等多种因素的制约,无法实现定量化,加工质量往往依赖于工人的加工经验[1]。加工过程大都采取边加工,边检测、边调整的加工模式,一个元件往往需要反复加工多次,制造效率和成品率低,重复精度差,产品指标个体差异明显。因此有必要对光学制造的各种影响因素进行综合分析,从大量加工数据中挖掘有用信息,寻找隐含的规律和确定性关系,形成工艺知识,指导设计和生产,使光学元件加工质量和效率得到提升。

近年来大数据分析技术得到突飞猛进的发展,在许多行业得到广泛应用。文章将以此为契机,通过对光学加工过程中各种数据的综合分析,发掘这些数据对光学元件加工质量的影响规律,建立它们与光学元件技术指标之间的关联关系,并和专家经验结合形成工艺知识,指导光学元件的设计和加工,实现光学制造过程的数字化、定量化、知识化。目前以美国、法国、德国和日本为代表的西方发达国家均在国防光学系统的需求牵引下,大力发展该项技术[2,3]。本项目组在国家重大专项的支持下也开展了相关研究,文章将以某抛光设备为例对光学制造过程中的大数据分析模型及方法进行论述。

1 工艺知识库系统基础架构

工艺知识库系统采用MAS(Multi-Agent system)结构,由五个Agent和三个支撑库组成。Agent之间是一种松耦合关系,每个Agent相互独立、高度自治[4,5],支持分布式应用,它们之间相互通讯,彼此协作,在系统中的具体分工如下:

1)数据采集Agent:主要负责光学元件制造过程中的环境信息、设备状态信息、工艺信息和各种过程数据的自动采集与集中存储,同时具备一定的预处理能力,能够对数据进行过滤、清洗、转换和分类。数据采集Agent相对独立,与其他Agent之间不存在数据交互,但和光学元件制造装备和现场检测设备之间存在密切联系,需通过驱动程序或OPC接口与其交互数据。

2)数据管理Agent:主要负责原始数据的集中管理、交互控制和前期处理,为用户提供开放的数据管理与查询接口,同时根据数据分析Agent的需要,从原始数据库中提取有用数据,并对其进行结构化处理。处理后的数据以数据包的方式传递给数据分析Agent。另外,该Agent还负责数据库的日常管理与维护,为异构数据库之间的交互提供支撑[4]。

3)数据分析Agent:主要负责从复杂的元件加工数据中,通过统计、聚类、关联、回归等数据挖掘方法,分析出与元件加工质量有关的各种输入信息与元件加工指标之间的关联关系,计算出关联度,推导出拟合函数,形成最终的工艺知识。

4)智能交互Agent:充当人机信息交互的桥梁,向用户提供可视化的操作界面,允许操作人员对各种Agent进行操控、配置和管理。智能交互Agent具备自主性和学习性能够根据用户输入的元件加工指标要求,在知识库的支持下自动推演出一套最优的加工参数,同时能够对错误的操作进行判别和屏蔽,并向操作着提供在线帮助。

图1 工艺知识库系统基本框架

2 大数据分析模型

大数据分析是工艺知识库系统的核心,如何发现光学制造过程中所产生的大数据中的隐含规律和有用信息是本文的研究重点,为此构建了图2所示的分析模型。该模型以数据挖掘引擎为核心,以数据库、模型库和工艺知识库为基础,采用大闭环结构:系统先从数据采集过程入手,实现原始数据的积累,再通过数据挖掘引擎发现变量之间的关联规则和依赖关系,形成工艺知识指导实际的设计和加工,然后再对加工环节产生的新数据进行分析处理,实现工艺知识验证和优化。随着加工过程的延续,积累的可供分析的原始数据越来越多,分析得到的工艺知识也越发丰富和精确。

3 数据挖掘方法

数据挖掘是大数据分析的最有效的技术手段,能够从大量的、有噪声的、模糊的、随机的数据集中识别出有效的、潜在的规律和有用信息。数据挖掘过程主要包括数据准备、数据选择、数据挖掘和结果表达五个基本环节,本文以光学元件抛光环节的去除效率指标分析为例,对数据挖掘的具体过程和方法进行阐述。

3.1 数据准备及选择

光学元件制造过程中采集到的原始数据非常丰富,既包括元件的属性信息、加工参数、检测数据也包括与之相关的环境信息、设备状态信息等,这些数据不都完全相关。数据准备就是针对需要分析的某项光学元件加工指标,根据工艺规则选出可能与之相关的影响参数,并对其做结构化处理,形成初始样本集,该样本集以光学元件编号作为关键字,将要分析的加工数据和检测指标关联起来形成K个数据样本。

图2 大数据分析模型

数据选择是在数据准备的基础上对初始数据样本进行清理和选择,剔除没有明显特征的对后续分析作用不大的数据样本,选择光学元件检测指标不合格及优良的特征样本作为分析对象,提高数据挖掘的效率和质量。

对于光学元件抛光环节的去除效率指标分析而言,需要提取可能对去除效率指标产生影响的加工参数进行分析,通过数据准备和选择形成表1所示的样本集,行代表数据对象,列代表数据对象的基本属性[6],Xij表示具体数值,为了便于分析将该数据集可用矩阵D来表示。

3.2 数据处理

由于影响光学元件表面粗糙度的因素是多方面的,直接对数据集D进行分析比较困难,需要进行分类处理,根据对象属性的相似性通过聚类方法将数据集D中的数据对象分为4组,分别用D1、D2、D3、D4四个簇表示。它们具有以下特性:

D1:抛光压力存在明显差异,其他属性相似;

D2:抛光转速存在明显差异,其他属性相似;

D3:工件摆幅存在明显差异,其他属性相似;

表1 数据样本集

图3 数据样本集矩阵

D4:工件摆速存在明显差异,其他属性相似;

对象间的相似性通过欧几里德距离进行测量,计算公式如式(1)所示,式中x代表簇中的任意对象,y代表簇心,xi、yi代表对象的属性,即需要进行相似性分析的特征参数。相似性判断需要工艺人员预先确定一个参考阈值σ,参考阈值越小对象间的相似性越强,但能够聚于簇中的对象数目越小,因此需要权衡处理。

3.3 关联分析

关联分析是研究变量之间是否存在某种依存关系,并对依存关系的相关方向及相关程度进行统计分析的数学方法[8],通过相似度计算公式(2)能够计算出变量之间的相关程度。为此需要对D1、D2、D3、D4四个数据集进行二元化处理,即,剔除对象的相似属性,仅保留存在明显差异的去除率影响参量和去除率检测值,形成新的数据集D'1、D'2、D'3、D'4。再利用公式(2)计算出两者之间的关联度R。

3.4 回归分析

回归分析是研究变量之间内在变动关系的数学方法,对于二元回归分析而言可以通过数据拟合得到自变量与因变量之间的回归方程的拟合曲线,用于参数分析与估算。对于光学元件加工数据的回归分析而言,将数据集D'1、D'2、D'3、D'4中的元素作为拟合函数的型值点,在确定了逼近函数类型后,通过数据拟合的方法可以得到变量与变量之间的拟合函数[8]。关于曲线拟合原理及方法的资料很多,这里不再赘述。

3.5 结果表达

关联分析的结果是光学元件加工指标与各种影响因素之间的关联程度,用关联度表示,能够为工艺设计提供定性参考。回归分析的结果是元件加工指标与各种影响因素之间的关联关系,用拟合函数表示,能够为工艺设计提供定量参考。关联度和拟合函数作为工艺知识存放在知识库中,用户通过智能交互Agent进行访问。

4 结论

本文从超精密光学制造的特点和面临的问题出发,提出了基于大数据分析和数据挖掘技术的超精密光学元件制造系统的工艺知识库构建技术,对系统架构、分析模型、实现过程和基本方法进行了论述,具有一定得参考价值。通过在某重大专项工程中的应用,初步验证了各项技术的可行性,对超精密光学制造的数字化、定量化和知识化起到了推进作用,具有较好的应用价值。但由于影响光学元件加工质量和效率的因素非常复杂,本文仅在聚类分析和二元化的基础上分析了单个参数对某个特定指标的影响,没有评判多个因素的综合影响,后续工作还有很大的研究空间。

[1]唐定勇,李兴兰.先进光学制造执行系统研究与开发[J].制造业自动化,2011.10:116-118.

[2]杨力.跨入21世纪的先进光学制造技术[J].光电工程,2002.12(增刊):1-4.

[3]杨力.先进光学制造技术[M].北京:科学出版社,2001.

[4]刘俊.基于大数据流的Multi-Agent系统模型研究[J].计算机技术与发展,2007,5:166-169.

[5]张洁,高亮,李培根.多Agent技术在先进制造中的应用[M].科学出版社,2004.

[6]胡可云,田凤占,黄厚宽.数据挖掘理论与应用[M].北京:清华大学出版社,北京交通大学出版社,2008.

[7]王晖,王琪,何琼.数据挖掘理论与实例[M].北京:经济科学出版社,2012.

[8]程正兴.数据拟合[M].西安:西安交通大学出版社,1986.

猜你喜欢
知识库元件光学
滑轮组的装配
承压类特种设备受压元件壁厚测定问题的探讨
汉语近义词辨析知识库构建研究
光学常见考题逐个击破
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
中核北方核燃料元件有限公司
高速公路信息系统维护知识库的建立和应用
带扰流孔波纹板蓄热元件的分析
宝马i3高电压元件介绍(上)
光学遥感压缩成像技术