钟放鸿 林翌臻 舒梦 林聪 沈冬晖 姚海滨
[摘 要] 香烟包装机通过综合检测平台接入了大量的外挂检测器,可以获得大量的一线实时数据。本文研究利用香烟包装机综合检测平台,利用大数据分析方法开发大数据分析软件,从中挖掘有用信息,用来指导故障定位,改进工艺过程,降低废品废料,提高生产效率和产品质量,不断提高生产制造水平。
[关键词] 检测器;包装机;大数据分析;集控
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 21. 031
[中图分类号] F270.7 [文献标识码] A [文章编号] 1673 - 0194(2018)21- 0080- 03
0 引 言
香烟的包装是卷烟生产中非常重要的工序,包装质量不合格的产品流入市场会给企业声誉带来严重影响。现在香烟生产企业为提高产品质量在包装机上加装了很多检测装置,但已安装的检测装置只实现了检测缺陷后剔除或告警的功能,并没有对生产的异常产品的原因进行分析,无法指导用户提高生产水平,减少残次品的比例。
这些检测装置可以集成到香烟包装机综合检测平台上,香烟包装机综合检测平台即能获取到大量的实时检测数据,一线实时检测数据直接反映了当前的生产状况、设备状况和包装质量,对这些数据运用大数据分析方法,进行提取分析,结果可以及时通知用户解决当前的故障,并通过具体的分析定位到具体的故障点,可以大大降低使用者和维护者的技术要求及工作强度。利用信息化手段进行烟草生产过程数据的监测、预测、控制,对烟草成品质量的提升具有重要意义,最终推动生产制造水平的不断提升。
1 设计思路
1.1 香烟包装机综合检测平台
香烟包装机为检测包装质量不合格的产品在各个工位加装了很多外挂检测器,这些外挂检测器一般都独自运行,香烟包装机综合检测平台是为了把香烟包装机上大量的外挂检测器集中起来进行控制。所有外挂检测器的逻辑处理都在该平台上运行。该平台包含若干个虚拟机,每个虚拟机对应一个或多个外挂检测器的功能,这些虚拟机上就拥有了对应的大量实时运行和检测数据。这些数据体现了机器运行状况、产品质量、异常状况等。
1.2 大数据
大数据的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
1.3 大数据分析
1.3.1 可视化分析
不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观地展示数据,让数据自己说话,让观众听到结果。
1.3.2 数据挖掘算法
可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。
1.3.3 预测性分析能力
数据挖掘可以让分析员更好地理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。
1.3.4 语义引擎
我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析、提取、分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。
1.3.5 數据质量和数据管理
数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。
1.3.6 数据存储,数据仓库
数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立的关系型数据库。为智能系统提供数据抽取、转换和加载(ETL),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。
1.4 大数据处理
具体的大数据处理方法其实有很多,但是根据长时间的实践,笔者总结了一个基本的大数据处理流程,并且这个流程应该能够对大家理顺大数据的处理有所帮助。整个处理流程可以概括为四步,分别是采集、导入和预处理、统计和分析以及挖掘。
1.4.1 采集
大数据的采集是指利用多个数据库来接收发自客户端(Web、App或者传感器形式等)的数据,并且用户可以通过这些数据库来进行简单的查询和处理工作。在大数据的采集过程中,其主要特点和挑战是并发数高,因为同时有可能要收集成千上万的数据。
1.4.2 导入/预处理
虽然采集端本身会有很多数据库,但是如果要对这些海量数据进行有效的分析,还是应该将这些来自前端的数据导入到一个集中的大型数据库,并且可以在导入基础上做一些简单的清洗和预处理工作。导入与预处理过程的特点和挑战主要是导入的数据量大,每秒钟的导入量经常会达到百兆。
1.4.3 统计/分析
统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求。统计与分析的主要特点和挑战是分析涉及的数据量大,其对系统资源,特别是I/O会有极大的占用。
1.4.4 挖掘
数据挖掘主要是在现有数据上面进行基于各种算法的计算,从而起到预测(Predict)的效果,实现一些高级别数据分析的需求。比较典型的算法有用于聚类的K-Means、用于统计学习的SVM和用于分类的Naive Bayes,主要使用的工具有Hadoop的Mahout等。该过程的特点和挑战主要是用于挖掘的算法很复杂,并且计算涉及的数据量和计算量都很大,常用数据挖掘算法都以单线程为主。
2 系统设计
香烟包装机综合检测平台的核心是中心服务器,外挂检测装置硬件通过路由器以以太网方式接入中心服务器。中心服务器是整个平台的核心,部署了若干个虚拟机,完成所有的检测功能。从各个虚拟机上可以获取所有的实时检测数据,大数据分析的来源就是这些数据。本系统结构可以分为两部分,一部分是数据端,另一部分是处理端。
2.1 数据端
本研究需要的数据来源比较单一,各个虚拟机上运行的功能软件均能提供。如下所述。
2.1.1 烟支空头检测
用于检测烟支两个端面,过滤嘴侧检查是否缺失过滤嘴,烟丝侧检测是否烟丝内陷、空头。可以提供的数据有滤嘴图像、空头图像、烟支生产速度、剔除率、生产效率、异常报警等。
2.1.2 五轮检测
用于检测烟盒内衬纸是否缺失、褶皱、歪斜等。可以提供的数据有小包内衬纸图像、当前位置小包的生产速度、剔除率、生产效率、异常报警等。
2.1.3 小包外观检测
用于检测包装机主机出口处的小包外观包装是否错牌、缺失、褶皱、歪斜、图案是否清晰等。可以提供的数据有小包外观图像、当前位置小包的生产速度、剔除率、生产效率、异常报警等。
2.1.4 散包检测
用于检测包装机辅机入口处的小包包装是否错牌、缺失、褶皱、歪斜、图案是否清晰等。可以提供的数据有小包外观图像、当前位置小包的生产速度、剔除率、生产效率、异常报警等。
2.1.5 大条外观检测
用于检测大条外观包装是否错牌,条盒缺失、褶皱、歪斜,透明纸褶皱、拉线错位,图案是否清晰等。可以提供的数据有大条外观图像、当前位置大条的生产速度、剔除率、生产效率、异常报警等。
2.1.6 条缺包检测
用于检测大条里小包是否缺失、小包是否缺支等。可以提供的数据有大条X光透视图像、当前位置大条生产速度、剔除率、生产效率、异常报警等。
2.2 处理端
处理端是大数据分析的核心,针对香烟包装机综合检测平台的特性,从实用性出发,结合日常生产中的实际需求,从以下方面展开分析。
2.2.1 運行状况分析
计算各个检测器的运行速度,并结合各个检测器的安装位置,设计一套运行状况模型,根据不断获得的数据去匹配运行状况模型,一旦发现偏移模型,说明有检测器运行不正常,可以及时进行报警。
例如某品牌烟生产速度模型为烟支生产速度8 000支/分钟,小包生产速度为400包/分钟,大条生产速度为40条/分钟。假如某一时段烟支空头检测上报的烟支生产速度为6 000支/分钟,小包外观检测上报的小包生产速度为200包/分钟,依据生产模型和烟支空头检测的上报,小包外观检测上报的生产速度应该在300包/分钟左右,实际上获取的是200包/分钟,说明小包外观检测很有可能出现故障,此时就会报警,提示操作人员排查问题。
2.2.2 异常分析
建立异常处理库,从上报的异常进行匹配处理方法,不断完善异常处理库,这样日积月累后会覆盖所有的异常场景,使得维护处理人员越来越方便操作,越来越省事。
例如某个检测器时不时地报CCD1连接异常,但又没有实际报警,此时很有可能是网络接头松动,系统自动及时提醒维护人员排查网络接线。
例如某个检测器获取的图像模糊不清晰,说明有可能是相机镜头松动,系统通过软件进行图像分析可以及时识别出来图像已经模糊了,系统自动及时提醒维护人员进行排查CCD相机镜头相关问题。
2.2.3 数据统计展示
依据上报的实时数据进行数据统计,建立理论统计模型,以动态曲线等方式进行展示,各个检测器的状况一目了然,界面统一清晰。实际运行中实时与理论统计模型进行比较分析,如果出入较大,说明相关的检测器可能存在异常,系统自动及时提醒维护人员进行排查。
2.2.4 预警
设定预警指标库,依据上报的实时数据进行分析,如果达到了某一预警指标,则系统自动进行提示,提醒操作人员及时排查处理。
例如某一检测器单位时间内剔除率超过某一设定值,则进行预警,提醒及时排查原因。例如某一检测器单位时间内平均生产率高于最大生产率,说明该检测器检测异常,可能是硬件原因导致,系统指示操作人员进行排查。
3 结 语
本文对香烟包装机综合检测平台的大数据分析进行了研究,经过前期充分的理论分析和方案论证,首台分析系统经测试达到了设计要求,给用户带来了很大的使用便利,得到用户的高度认可。但同时该平台还有一些改进的空间,如香烟包装机本身的数据没有接入进来,还有很多待进一步分析整理挖掘的方面,后续工作应继续改进提高并加以推广,以充分发挥平台的价值。
主要参考文献
[1]周涛.为数据而生[M].成都:电子科技大学出版社,2016.
[2]何金池.大数据处理之道[M].北京:电子工业出版社,2016.
[3]陈明.大数据基础与应用[M].北京:北京师范大学出版社,2016.