(浙江美浓世纪集团有限公司,浙江杭州 311100)
自2013 年国家烟草专卖局发布了有关烟草包装材料回收的文件以来,烟草行业的工商企业都加强了烟草瓦楞包装箱的回收利用。2018年,烟草行业商业企业共向工业企业返还卷烟包装11473.92百万次(不包括非相邻省份主要品牌的收益),总收益率为94.2%,比上年同期高0.72个百分点[1-2]。随着中国将人工智能推向国家战略水平,工业自动化程度不断提高,工业企业的生产方式正在发生变化,并逐渐从传统模式向自动化智能模式转变[3]。在过去的两年中,已经在人工智能领域开发和应用了许多技术,并且图像识别技术是基于人工智能的代表性技术之一。卷烟纸箱通常专用于某种产品,因此回收必须梳理产品分类,以实现逆向物流并返回源头的工业公司复用。对于如此庞大而琐碎的回收业务,我们需要根据公司的实际需要提高分拣效率和速度,减少人工判断并降低回收成本[4]。
当前,大多数人工智能的学习准确性需要大量投资,而自动机器学习(AutoML)是减少数据预处理,特征提取,模型选择,参数调整等方面的新兴方向。它使企业可以低成本采用人工智能。通过比较百度的EasyDL,阿里云视觉智能中的图像识别,亚马逊的Amazon SageMaker Ground Truth,谷歌的Google Cloud AutoML,微软的Custom Vision Services以及其他自动化机器学习系统[5],百度EasyDL提供了简单的界面和便捷的访问。因此,在本文中,我们将把百度的EasyDL用作图形深度学习工具,以实现在卷烟包装回收中的价值,并初步探讨在其他工业生产环节中的实现前景。
分类识别系统的整体结构如图1所示。传送带将要分类的产品运送到识别和检测位置。光电传感器检测纸箱的入口,工业相机自动捕获延迟的贴标位置,以获取目标瓦楞箱贴标区域的原始图像。离线SDK 通过本地PC 分发(离线SDK由百度EasyDL平台生成),以识别和判断所拍摄的图片并获得相关的控制指令。发送控制指令至变速箱分类控制模块,对相关的异常包装进行分类,并根据瓦楞箱上的条形码执行产品分类信息收集,并为再次分拣提供信息依据。
图1 分类识别系统的整体结构Fig.1 The overall structure of the classification and recognition system
分拣识别系统硬件平台主要包括:PC一体机、光感应模块、工业相机、条码识别模块、分拣控制模块、声光报警模块、传送带、电源等[6]。
其中,PC一体机是本地部署的核心,负责收集图像信息和生成控制命令,报警异常并显示实时结果,并可以根据实际情况计算块内的对齐数量。光电传感器模块主要用于装配线上,以检查盒子是否已进入图像识别区域并触发通知信号。工业相机主要用于收集图像信息。条形码识别模块用于在进入前端识别和分类链接后对不同的产品包装进行重新分类。分类控制模块用于对未贴标签的产品进行分类或对产品进行分类,声光报警模块用于在系统异常时产生报警。
分拣识别系统因为考虑到很多工厂实际情况不具备上网条件,所以软件基于C#和百度EasyDL的离线SDK进行开发。后期基于百度开放平台飞桨(PaddlePaddle)以及Python做了部分深度学习模型的进一步尝试,用来改进和提升异常外观的判断和学习效率提升。
整个过程可视化且易于操作。训练用的图片和测试数据准备就绪后,您可以在几分钟内获得自定义模型。它分为四个阶段。(1)数据准备;(2)模型创建;(3)模型训练;(4)模型发布。
我们使用百度EasyDL定制的培训平台对瓦楞箱图像进行深度学习。该平台现在支持深度学习,例如:图像分类、对象检测、声音分类和文本分类。因为它在图像中被识别,所以本文使用“对象检测”模型。对象检测模型可以识别图像中对象的名称,数量和位置,并且可以识别图像中具有多个对象的场景。当平台用户进入平台时,它首先创建一个模型和数据集,上传一个纸板箱的图像,并在数据集管理中显示该图像。其次,训练模型并测试其有效性。最后,在线模型获取API或离线SDK。
创建模型后,在“数据中心”中创建一个数据集,在“数据集管理”中找到刚创建的数据集,然后上传捕获的静止图像。使用EasyDL平台的标记工具拖移框架,以构图框。
在为所有照片添加注释后,通过在“模型中心”中选择“训练模型”来训练模型。EasyDL平台将使用模型数据中70%照片进行训练,其余30%照片用于测试模型的有效性,培训大约需要3个小时。
mAP是EasyDL培训平台中衡量模型效果的指标。对于物体检测任务,每一类检测目标都可以计算出精确率和召回率,在不同阈值下多次计算或试验,每个类都可以得到一条P-R曲线,曲线下的面积就是AP的值。“mean”的意思是对每个类的AP再求平均,得到的就是mAP值,mAP值越接近于1,模型效果越好。精确率为正确识别的物体数与识别物体总数之比,召回率为正确识别的物体数与真实物体数之比。
在物体检测模型中,我们发现使用百度超大规模预训练模型的YOLOv3_DarkNet 相比普通模型在各类数据集上平均提升5.12%,使用百度超大规模预训练模型的Faster_RCNN,相比于普通预训练模型,平均提升1.11%。并且,在物体检测方向,新增了Cascade_Rcnn_ResNet50_FPN模型、YOLOv3_ResNet50vd_DCN模型、YOLOv3_MobileNetv1网络,以及基于百度超大规模预训练模型训练出来的YOLOv3_Darknet、Faster_R-CNN_ResNet50_FP,其中,Cascade_Rcnn_ResNet50_FPN通过级联多个检测器以及设置不同IOU 的重采样机制,使得检测器的精度、和定位的准确度进一步提升。因增加了可形变卷积,对不规则纸箱和破损的检测效果也有一定的正向提升。
在AI产业化过程中,新兴IT企业已经积累了大量优质的算法框架、模型和数据,这些优质的AI技术正是产业AI化过程中行业用户所需要的,聚合AI最强算力平台、最优质的算法模型开发能力和最优质的集成、部署和服务能力,从而支撑和加速各行业、各产业与人工智能的融合,让各个行业、各个产业具备可感知、自学习、可进化的能力,最终帮助用户完成业务智能转型升级。自动化学习平台在卷烟包装箱循环回收环节取消不必要的工序、合并工序、减少搬运、安排最佳的顺序、找出最经济的移动方法、尽可能地减少在制品的贮存供应链压力。
EasyDL将EasyDL图形开发的易用性及编程的灵活性结合在一起。在提供了很多便利的同时,又将控制权交给了客户,让客户可以更加灵活和简便的使用深度学习技术,激发人工智能+的无限可能,而PaddlePaddle是百度主推的开源机器深度学习平台。它是Parallel Asynchronous Distributed Deep Learning的简称,也为我们提供了大量的深度学习模型库。数字化和机器学习是现代网络信息技术不断发展的产物,该技术如果在印刷包装行业得到良好的应用,不仅可以大大提高印刷包装产品的整体质量和水平,而且也可以大大减少印刷包装整个过程的时间消耗,提升效率实现降本增效,从而带动整个印刷包装行业的良性发展。因此,我们可以大胆地预料,在印刷包装行业的未来发展中,人工智能作为未来工厂的数字印刷包装技术之一将发挥举足轻重的作用,更加适合当前的市场和技术发展需求。
卷烟包装箱回收是供应链包装逆向物流的一种,由于涉及到工商企业与其他单位,因此整个流程比较复杂,需要考虑各方的工作任务,并权衡各方的利益。对于卷烟箱的回收工作,一方面需要结合企业自身的特点,选择合适的运行管理机制,做好各机构的分工和工序之间的衔接,保证整个系统的顺畅运行。另外,对于烟箱回收利用的作业方式也要进行改善,保证纸箱在经历所有的环节之后还能保持完好的状态,相关设备也要适应循环使用的纸箱的作业要求。