潘建双
(首钢京唐钢铁联合有限责任公司信息计量部,河北唐山 063200)
随着工业智能化的不断发展,智能制造热潮持续升温,不同类型的数据量呈现指数增长,但采集到的数据准确性确难以得到保障。因此,需要对采集的数据进行实时监测,将数据采集[1]过程中的异常数据识别出来进行及时处理。本文运用控制图的判异准则和轨道衡皮重历史计量数据建立数据动态识别模型,用以自动快速识别实时计量数据是否正常,以保证轨道衡计量数据的准确性,并通过在轨道衡的应用,来辐射冶金及其他行业数据监测领域,为识别不同领域的不同类型数据提供可靠的技术支持。
选用一台轨道衡进行实验,通过采集该衡器的皮重历史计量数据,并按月、季度和年进行归纳和整理,计算皮重的平均值和标准差,来确定控制图的中心线、制上限以及控制下限,用于识别轨道衡测量的实时计量数据中的异常数据。当识别过程达到预设的更新阈值时,对控制图进行更新,获得控制图新的中心线、控制上限以及控制下限,并运用新的控制图识别轨道衡测量的实时计量数据中的异常数据,以实现对计量数据的实时识别,并在轨道衡计量系统中进行显示、控制与处理。其次,根据每个月的历史计量数据和计算出的结果调整控制上、下限,直至确定常规皮重的波动范围。
以9月的历史计量数据为例,利用六西格玛工具计算出控制图的中心线、控制上限以及控制下限。其中,有中心线=,控制上限UCL=+Nσ,控制下限LCL=-Nσ,
为历史计量数据的均值,N表示倍数,σ表示历史计量数据的标准差;控制限常规为均值的3倍标准差,但历史计量数据为皮重数据,基于该皮重数据的历史计量数据中的异常数据比例进行分析可确定N的最优取值为4,即控制限为均值的4倍标准差,识别效果如图1。
图1 9月数据不同倍数下识别结果及验证Fig.1 Identification results and verification at different multiples of September data
获取轨道衡的第一历史计量数据,基于第一历史计量数据,确定控制图的第一中心线、第一控制上限以及第一控制下限。基于第一中心线、第一控制上限以及第一控制下限,识别轨道衡测量的第一实时计量数据中的异常数据。当识别过程达到预设的更新阈值时,获取轨道衡的第二历史计量数据,对控制图进行更新,获得控制图的第二中心线、第二控制上限以及第二控制下限。基于第二中心线、第二控制上限以及第二控制下限,识别轨道衡测量的第二实时计量数据中的异常数据。
第一历史计量数据可为毛重或皮重;具体的,第一历史计量数据表示一段时间内的所有历史数据,例如可为1周(7日)内测量获得的数据,1个月(或30日)内测量获得的数据,一个季度内测量获得的数据,1年(或365日)内测量获得的数据。
第二历史计量数据中包含第一实时计量数据。具体的,第二历史计量数据可完全由第一实时计量数据构成,也可由部分第一历史计量数据和第一实时计量数据构成。
当第一历史计量数据和第二历史计量数据均为30日的计量数据时,预设的更新阈值为15日,则第二历史计量数据由15日的第一历史计量数据和15日的第一实时计量数据构成,这样可以保留第一历史计量数据的特征,并包含第一实时计量数据的特征,保证控制图更新的连续性,提高了识别的准确度。
更新阈值可为第一历史计量数据的计量时长,也可为第一历史计量数据计量时长的1/2、1/3、1/4等,不作限制;此时识别过程达到预设的更新阈值表示识别时间达到预设的更新阈值。另外,更新阈值还可为实时计量数据的数量,例如更新阈值为10条实时计量数据、100条实时计量数据、1000条实时计量数据,等;此时,识别过程达到预设的更新阈值表示识别数量达到预设的更新阈值。
第一数据获取模块,用于获取轨道衡的第一历史计量数据;
控制图构建模块,用于基于所述第一历史计量数据,确定控制图的第一中心线、第一控制上限以及第一控制下限;
第一识别模块,用于基于所述第一中心线、所述第一控制上限以及所述第一控制下限,识别所述轨道衡测量的第一实时计量数据中的异常数据;
第二数据获取模块,用于当识别过程达到预设的更新阈值时,获取所述轨道衡的第二历史计量数据;其中,所述第二历史计量数据中包含所述第一实时计量数据;
表1 数据动态实际识别结果表Tab.1 Data dynamic actual identification results table
控制图更新模块,用于基于所述第二历史计量数据对所述控制图进行更新,获得所述控制图的第二中心线、第二控制上限以及第二控制下限;
第二识别模块,用于基于所述第二中心线、所述第二控制上限以及所述第二控制下限,识别所述轨道衡测量的第二实时计量数据中的异常数据。
选择一台轨道衡,采集其每月皮重历史计量数据。利用采集的皮重计量数据构建控制图,并对控制图进行不断的更新,来构建初始数据动态识别模型。将构建的数据动态识别模型固化在计量系统中,对计量数据进行实时识别。具体识别结果如表1。
在表中,下划线黑体的数据为识别出的异常数据。
通过运用该数据识别方法对输入的实时皮重计量数据进行识别,识别的准确率可达到100%。同时,此方法可对毛重和净重进行识别,将自动识别出的异常计量数据在轨道衡计量系统中进行显示。因此,此方法可为识别不同领域的不同类型数据提供可靠的技术支持。