安泽武,马秀清,张 鑫,程 伦
(1.北京航空航天大学机械工程及自动化学院,北京100191;2.北京化工大学机电工程学院,北京100029;3.北京化工大学信息科学与技术学院,北京100029)
市场上现行的大部分纸币清分器械,普遍存在价格昂贵,但是在一些例如公共交通行业对于纸币清分设备具有相应的需求[1],目前现行的纸币清分器械不适合在这种场景下使用,因此在保证高的识别率与较低的误识率情况下,研发低成本的纸币清分系统具有重要意义[2]。
在整个纸币清分机械系统中,精巧并且鲁棒的纸币识别算法是关键问题[3]。文献[4]指出目前实现纸币面额识别的方法有多种,可以利用牵引结构和光电发送接收传感器,利用专用数字处理器对纸币上的磁性油墨和磁性安全线进行识别。此识别算法涉及的传感器种类较多,导致纸币清分设备复杂。文献[5]提出了一种基于神经网络的识别方法。这种方法识别率较高,但是对图像噪声敏感以及对算力要求比较高,也容易陷入局部最优,造成纸币识别错误。文献[6]利用人民币光学特征根据纸币上特殊位置的特征实现纸币鉴别,利用红外光照射真假纸币后其反射及穿透信号的强度差异鉴别纸币。文献[7]提出了利用Gabor滤波器提取纸币图像纹理特征进行网格划分,根据纹理特征进行纸币种类识别。由于纸币表面纹理容易在流通过程中损失,单纯利用局部纹理特征容易造成误识别。
综上所述,在低成本纸币清分系统需要满足价格低廉,且其识别算法对纸币特征的提取和表示具有鲁棒性。这里提出纸币清分系统方案,采用价格低廉的一种彩色光导频率的集成电路作为纸币信息采集方式,通过分析纸币本质特征,对传感器信号做算法处理。通过分析算法处理后的纸币特征,将其特征映射到高维空间,利用支持向量机进行纸币种类的识别。以此为核心算法设计了纸币清分机械结构,具有成本低廉、操作简单以及维护便利等优势。
这里所述的纸币分类设备,主要包括纸币输送单元、纸币面额识别单元、纸币分类单元、纸币存储单元、LCD显示单元以及纸币管理单元等组成。设备外壳面板上设置有纸币输入口,在纸币输入口的内部设置有纸币输送和分类装置,在纸币输送和分类装置的下方设置有多个按纸币面值区分的纸币存储盒。经过分类处理的纸币经过LCD显示纸币数量、纸币面额和投入总额。可以将多台设备在不同时间段的工作数据使用串口通信存传入到Web系统,将相关数据存储在数据库中,实现对于纸币分类以及面额统计的管理。
纸币输送单元:纸币输送单元主要有输送口,预紧夹持轮,齿轮传动机构,触发杠杆,该触发杠杆的支点下部竖向设置在纸币输入口内的中部,在触发杠杆的顶部设有触发开关,触发开关两端连接有MCU,MCU用来控制直流电机运动,直流电机带动夹持滚轮运动。
纸币面额识别单元:纸币面额识别单元主要由颜色传感器,MCU微控制器以及白平衡板构成。由于各种面额人民币颜色存在显著差异,主要通过颜色传感器识别纸币上人物头部固定位置颜色,通过改进色彩空间识别算法处理得到不同类型纸币有关的特征信息,将其输入到训练好的支持向量机中做分类决策,得出输出纸币是何种面值。
纸币分类单元与显示单元:传感器传入的颜色信号经过处理之后得到面额信息,利用控制器控制步进电机驱动丝杠导轨平台运动,将纸币送入到对应的纸币存储盒当中,实现纸币的分类。同时将信息记录通过显示单元显示,利用LCD屏幕显示当前传送纸币面额,已收纳纸币数量和已收纳纸币总额。
图2 纸币输送单元结构Fig.2 Structure of the Transportation Unit
图3 纸币面额识别单元Fig.3 The Recognition Unit of RMB
图4 纸币分类与显示单元Fig.4 The Classification and Display Unit of RMB
纸币管理单元:纸币管理单元主要功能是在经过一段工作周期之后,对多台设备的纸币信息和纸币数量进行统计和存储,为了方便使用,将统计的显示在Web前端上,将这段工作周期内分拣的纸币数量和面额等信息存储在数据库当中。
图5 纸币管理单元Fig.5 The Administration Unit of RMB
图6 纸币管理系统界面Fig.6 RMB Management System Interface
由于纸币的不同面值所使用的颜色不一样,采利用纸币的颜色来识别纸币面值。由三基色原理得知:自然界所有的色光均可表示为R/G/B的叠加合成[8]。纸币上颜色分布不均匀,R/G/B存在很大差距,并且轻易的振动也都可能导致纸币位置变化而引起R/G/B数据的巨大变化,所以单使用R/G/B算法虽然可以精确识别颜色,但是采用R/G/B数据不稳定性。
由于明度与饱和度的影响会引起R/G/B数据的不同。单纯以R/G/B作为纸币面额判定的特征。
图7 明度与饱和度的导致R/G/B的变化Fig.7 The RGB’s Variation of Brightness and Saturation
鉴于以上情况,要排除R/G/B数据的较大波动,需要排除明度与饱和度的影响,使用色调区分纸币颜色。HSV可以使用圆锥形状的模型描述,每个颜色对应于一个角度值,称为色调(H),饱和度(S)用来描述距离中心轴线的距离,使用0-1表示,垂直轴长度用来表示亮度(V),使用0-1表示[9]、[10]。
从R/G/B转换为HSV色彩空间,设(r,g,b)分别是一个颜色的红、绿和蓝坐标,设MAX为r,g,b中的最大值,设MIN等于这些值中的最小者,设MED为r,g,b中中间值。要找到HSV空间中的(H,S,V)值,这里的H∈[0,360]是角度的色相角,而S,V∈[0,1]是饱和度和亮度。计算为:
支持向量机是模式识别中的一种模型,可以对小样本的数据进行学习,对于大容量、高维度数据集有很好的泛化性能,支持向量机的模型可控[11]。其基本原理为,根据训练集的特征在样本空间中找到一个合适的超平面,能够将不同种类的样本分开[12]。
定义选择输入样本的特征向量X=[x1,x2,x3,…,xm],定义Y=[y1,y2,y3,…,ym]作为支持向量机模型目标输出,定义权重矩阵为W=[w1,w2,w3,…,wm]。
对于上述样本,在特征空间中的高维超平面函数表达式为:
式中:W-超平面,b特征空间中的超平面到原点的距离。则对于某一特定样本Xs=[xs,xs,xs,…,xs],其到超平面之间的距离可以定义为:
对需要分类的样本分类的时候,样本的特征及超平面关系应该尽可能满足条件:
为了防止过拟合,加入软间隔的方式,此时为了求得在软间隔处理下优化的目标函数为:
其中,lexp(exp利用拉格朗日乘子法对上述方程进行最优化求解,得到在所要使用的样本下的最优分类界面。
在样本训练的过程,无法保证样本的特征表达X=[x1,x2,x3,…,xm]是线性可分的,可能不存在最优分类界面,需要将样本特征从原始的空间特征中做高维特征空间映射,使得样本在映射完成的高维特征空间中可分。
将上述初始特征空间X=[x1,x2,x3,…,xm]进行核函数变换:
在特征空间中的高维超平面函数表达式变为:
通过纸币颜色进行纸币种类的识别,关键是要提取出纸币颜色特征。为了增强该算法的普适性需要使用合理的样本数据,我们使用的实验材料为不影响正常流通的新旧各异的各类人民币各一百张,测试样本来自于便利店与超市,满足样本选取随机性要求。
图8 实验过程Fig.8 The Process of the Experiment
测量位置为人像位置,纸币进入投币口后,颜色传感器正好处于采集信息的位置。颜色传感器采集到的是(r,g,b)信息,利用我们提出的改进算法求出其H值,以下为我们的实验数据。
图9 人民币H值测量Fig.9 The Measurement of RMB
利用质量学3σ原则[13],对实验数据进行统计学分析。构造质量学单值控,如图10所示,采用改进型色彩空间算法提取的纸币特征值具有相对鲁棒的特征。根据上述单值图如果在线性空间中利用提取到的色彩特征值进行分类会存在有些样本不满足合适分类条件。为了增强识别的准确性,我们将提取到的特征利用高斯核函数进行高维变换,在高维数据下寻找最优分类界面,利用上述提到的支持向量机模型作为纸币分类的分类器。分别构造分类器。实验数据证明,识别率可以达到98.92%。
图1 系统组成单元Fig.1 The Component Units of the System
图10 人民币单值控制图Fig.10 Single value control chart of RMB
表1 不同面额纸币H值统计Tab.1 H Value Statistics of Different RMB
表2 纸币面额识别Tab.2 Denomination Recognition of RMB
通过上述实验数据,我们得到对于磨损值不是很大且能保证正常流通的货币,通过使用传感器采集色彩信息利用改进算法提取特征能,采用基于高斯核函数的支持向量机作为纸币分类的分类器,能够实现纸币面额的识别且具有良好的精度与准确度。
这里通过对纸币特征的分析,选择改进色彩空间算法进行特征提取与噪声抑制,对提取到的特征利用高斯函数映射到高维空间,通过支持向量机模型对纸币进行分类,我们实验的测试证明,此方案具有较好的精度和准确度。并由其为核心算法设计了一种成本低廉的新式纸币分类器械,既能够满足纸币实时清分也能够实现阶段性数据存储和数据管理,实验证明该机电一体化系统具有良好的精度与准确度,价格低廉。