智能图像处理与应用设计实例

2022-01-09 05:20:04梁文威麦淳铭宋泽生梁薇薇
计算机技术与发展 2021年12期
关键词:树莓图像识别智能手机

王 君,梁文威,麦淳铭,宋泽生,梁薇薇,蒲 磊

(1.中山大学南方学院,广东 广州 510970;2.广州恒通智联科技有限公司,广东 广州 510630;3.南昌大学,江西 南昌 330027;4.重庆邮电大学,重庆 400065)

0 引 言

智能图像处理技术紧跟科技前沿,其算法被广泛应用于实际生产中,带来了很多的便利和经济价值,尤其是基于计算机视觉图像的识别技术。由于手机性能或者手机寿命等原因,产生了很多的弃用手机,废弃手机造成资源的浪费,污染环境[1-2]。而对手机检测和回收的机构企业较少,而且手机检测和回收的手段和技术相对落后,人工检测程度较低,客观性较差,难以提高检测回收速率,不能适应现代的自动化流水线[3]。

图像识别饮料瓶智能回收系统以搭载Linux系统的树莓派3B+作为主控制器,以32位ARMCotex-M3内核单片机为辅助控制器,构成具有上下位机交互的完整系统。上位机树莓派3B+主要为系统提供图像识别技术功能支持,对放入系统中的物体进行图像识别,判断其是否为瓶子。下位机通过分析上位机所识别的结果以及识别的数量进行金额换算,进而将金额数据传输到云数据库中。用户在手机APP端就可以刷新查看到当前自己用户账号的账户金额的变化。

1 机器视觉的回收系统研究

对于可回收再利用资源,应加强对其的回收利用。回收系统可以降低人工分拣过程的劳动程度,提高整体工作效率,从而降低生产成本。用机器视觉对流水线上的手机实现不同类型的识别分类,用以实现将海量非智能手机和智能手机的分类处理回收,以提取贵重金属和稀有金属[4-5],充分利用资源。一般的机器视觉回收系统会采集回收物图像,经过图像处理可以得到其形状和尺寸的数据,最后按比例算出图中物体的长度信息并和标准范围作比对。机器视觉的手机识别与回收系统流程设计如图1所示。

图1 机器视觉的手机识别与回收系统流程

1.1 搭建机器视觉的手机识别与回收系统平台

机器识别分拣[6],摄像头的摆放、光照、角度,都会影响检测的准确率[7-13]。基于机器视觉的手机识别与回收系统,以搭载Linux系统的树莓派3B+作为主控制器,以32位ARMCotex-M3内核单片机为辅助控制器,构成具有上下位机交互的完整系统。上位机树莓派3B+主要为系统提供图像识别技术[14],用两个摄像头,分别配以辅助补充光源,对放入系统中的物体进行正反面的识别,以相似度分类识别手机[15-17],如图2所示。

图2 基于机器视觉的手机识别与回收系统位置

1.2 树莓派和控制模块

树莓派3B+是基于ARM的微型电脑主板,外形比较小,却具有电脑的所有基本功能。基于云技术的数据传输与存储功能的设计,以树莓派3B+控制摄像头通Tensorflow来检测图像中的物体是否为手机。随后将所识别到的图像数据传输至OneNET云服务器上,判断该物体是否为非智能手机/智能手机,同时OneNET云服务器记录相关数据。流程如图3所示。

图3 图像识别模块和控制模块流程图

2 识别方法的设计

2.1 图像预处理

图像预处理将收集的图像数据灰度化,依据灰度图像直方图,采用自动增强对比度算法进行图像增强。然后,通过阈值分割提取目标二值图像,并通过均值滤波进行平滑去噪,对滤波后的目标图像求最小外接矩形,可以得到其形状和尺寸的数据特征和轮廓特征。

2.2 卷积神经网络算法

卷积神经网络算法是模仿脑神经元连接实现感性思维。神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。卷积神经网络是借助卷积核对输入特征进行特征提取(卷积、批标准化、激活、池化、舍弃),再把提取到的特征送入全连接神经网络进行识别预测。

本研究采集大量手机图片(输入特征,标签)数据对构成数据集→再把数据集投入到搭建好的神经网络结构→神经网络通过反向传播,从后向前逐层求损失函数对每层神经元参数的偏导数,而迭代优化参数得到模型→模型读取新输入的特征→输出识别结果,见图4和图5。

图4 手机图片识别的神经网络搭建

图5 非智能手机/智能手机轮廓特征提取图

通过神经元计算模型(MP模型)的全连接网络,可得输出结果y=输入特征x*权重w+偏置项b,见图6。

图6 简化的MP模型

运用梯度下降法,沿损失函数梯度下降的方向寻找损失函数最小值,得出最优参数权重w和偏置项b。梯度下降法更新参数计算公式见式(1)和式(2),其中lr为学习率,是一个超参数,是损失函数梯度下降的速度。学习率不能设置的过大或过小,当学习率设置的过小时,参数更新速度会变慢;当学习率设置的过大时,参数更新会跳过最小值。一般先设置较大的学习率,快速得到一个较优解,然后逐步减小学习率,使得模型在训练的后期趋向于稳定。

(1)

(2)

当损失函数最小时,则参数权重w和偏置项b会出现最优值,使得前向传播的预测值和实际的标准值无限接近,从而得到一个误差率最小的手机识别训练模型,提高手机识别的准确率。

2.3 关于Tensorflow机器学习

Tensorflow训练法是比较有效的识别方法。Tensorflow是一种深度学习的框架,支持Macos、Ubuntu、Window等多系统运作,支持GPU、CPU运算。Tensorflow是一个人工智能学习系统,是用来实现神经网络的内置框架学习软件库,该系统被广泛用于图片识别等多个领域。

3 识别流程和结果

本研究需要收集大量的手机照片作为输入数据。选取1 000张不同的手机图片,分别是非智能手机500张和智能手机500张,并且把这1 000张图片以10∶1的比例分为训练、测试的图片集。同时在选择手机的图片时,必须要保证所选取的图片有一定的清晰度并具有多样性。

使用labelImg软件对选取的手机图片进行标记。当对一张照片完成标注时,所标注的图片会生成一个XML文件,图片和XML文件都是1∶1相对应的。XML文件是一种用于标记电子文件使其具有结构的标记语言,XML记录了标注文件的信息,如长度、宽度和像素等信息,XML文件对于要标注的识别物体的信息有非常重要的作用。

识别手机的类型如图7所示。

图7 识别手机的类型(非智能手机/智能手机)

如表1所示,经过对手机实物进行实际识别操作,手机识别准确率为90%以上,与预测值的准确率较为接近。总体上识别准确率较高,满足设计基本需求。个别手机识别不出来的原因为:手机图片输入进卷积神经网络的特征数量仍然不够,可以适量增加训练的样本,以提高模板库的特征;但为了满足单片机的实际应用要求,也要控制训练样本的数量。

表1 非智能手机与智能手机的识别准确率

最后,用STM32单片机的PWM信号是通过配置占空比来配置脉宽的输出配置,使能定时器和相关IO口时钟,初始化IO口为复用功能输出,初始化定时器ARR、PSR等,初始化输出比较参数,使能定时器TIM,通过不断改变比较值CCRx,控制占空比效果,从而控制舵机将识别出的手机送至回收箱。

4 结束语

以手机分类识别为例,具体展示了智能图像处理方法的实用性和方便性。分类识别中,用Tensorflow算法对手机的特征信息和标准模板库作范围比对,实现了手机图像识别,并以Linux系统的树莓派3B+作为主控制器,以32位ARMCotex-M3内核单片机为辅助控制器,完成手机识别与回收。测试证明,该系统稳定且手机识别准确率较高,识别稳定快速。该系统成本低廉,可节省分类的人力,且可流水作业,便于贵重金属和稀有金属的智能化回收利用,减少环境资源浪费。随着智能图像处理的广泛应用,必将极大提高生活品质。

猜你喜欢
树莓图像识别智能手机
智能手机是座矿
智能手机脸
英语文摘(2020年5期)2020-09-21 09:26:30
基于Resnet-50的猫狗图像识别
电子制作(2019年16期)2019-09-27 09:34:50
高速公路图像识别技术应用探讨
基于树莓派的骑行智能头盔设计
电子制作(2019年11期)2019-07-04 00:34:32
假如我是一部智能手机
趣味(语文)(2018年8期)2018-11-15 08:53:00
图像识别在物联网上的应用
电子制作(2018年19期)2018-11-14 02:37:04
图像识别在水质检测中的应用
电子制作(2018年14期)2018-08-21 01:38:16
基于树莓派的远程家居控制系统的设计
电子制作(2017年17期)2017-12-18 06:40:43
响应面法优化红树莓酒发酵工艺
中国酿造(2016年12期)2016-03-01 03:08:19