黄峻远
(广电运通集团股份有限公司,广东广州 510670)
传统的人工数钞票、点钞票的方式已越来越少,这些方式都或多或少存在不便利、不智能、容易出错等问题。随着科学技术的发展,钞票处理设备、图像处理技术、钞票识别技术越来越成熟,也更多地应用到各个领域,如金融领域、智慧交通领域、旅游便民领域等,可以大大提升工作效率,减少时间成本和人力成本。
钞票处理设备在金融领域上一般称为“机芯”,是存取款设备最核心的部件,也是中国自主核心研发的“机芯”。设备系统主要包括钞票走纸传动机构、图像采集、图像处理、图像识别及鉴伪和主控处理模块等。
首先,钞票从设备入钞口进去,通过传动机构将钞票输送到钞票识别模块(即NV 模块),识别模块通过扫描传感器扫描钞票,采集最原始的图像数据,并转换成数字信号。其次,信号被送到图像处理系统进行图像预处理,主要包括有边缘检测处理、噪声处理、图像矫正处理等。最后,通过图像识别对图片进行数据提取、特征分类、面值识别、冠字号识别、钞票鉴伪等。钞票处理设备系统框图如图1 所示。
图1 钞票处理设备系统框图
钞票识别模块主要由走纸传动机构、CIS 接触式图像传感、图像处理组成。钞票通过走纸传动机构传送到CIS接触式图像传感器,CIS 接触式图像传感器对钞票进行扫描,扫描后得到模拟信号,再通过放大器将信号放大,通过A/D 转换模块将信号转换成数字信号,经过信号电平转换后,将信号送到DSP 进行图像采集,并进行一系列图像处理、算法处理等。上述3 个主要步骤的详细描述如下。
(1)走纸传动机构[1]由步进电机、传动装置(齿轮、皮带)、光电传感器组成。走纸传动机构通过光电传感器检测钞票的进入,但设备检测到钞票时,检测电压发生变化,主控DSP 检测到信号变化,即可启动CIS 接触式图像传感器工作,对钞票进行扫描,收集数据。同时,只有保障CIS 管的扫描速度和纸张传送速度基本一致,才不会导致分辨率扫描异常的现象,最大程度保证扫描图片的质量。完整钞票扫描完毕后,光电传感器检测到电平变化,信号以事件的方式传到主控DSP 后,主控随即将CIS 传感器停止工作,一个完整的扫描图片的动作即可完成。
(2)CIS 接触式图像传感器是接触式感应装置[2],识别系统一般通过接触式图像传感器(Contact Image Sensor,CIS)对钞票进行图像采集,具有采集速度快、稳定性高、受环境因素影响小等特点。钞票处理设备的识别系统需要借助上述走纸传动机构,将需要采集的票据样本以一定的速度经过CIS 传感器表面,LED 发出光,光在钞票上产生反射光,鉴于不同颜色的光反射角度不同,钞票上形成的反射光会接收到不同的模拟信号,再通过放大器进行放大,经A/D 模数转换器转成数字信号,然后传输到主控DSP,即可完成图像数据采集的工作任务。
(3)钞票图像处理是整个钞票处理最为重要的环节,将采集到的图像进行处理,并完成对钞票的识别及鉴伪,最后将结果输出。因为采集的数据量非常大,且要求处理快速。而一般的单片机系列(51 系列、STM32 系列等)无法满足高运算要求。因此,需要采用DSP(数字信号处理)进行钞票图像的处理及常规操作控制。钞票识别模块整个处理款图如图2 所示。
图2 钞票识别模块处理框图
对钞票进行图像预处理,是钞票识别前的一个最重要的环节,它能大大提高后续钞票识别及鉴伪的能力和效果。钞票的预处理一般包括噪声处理、边缘处理、图像矫正等措施,详细如下。
噪声主要是由于钞票本身的残缺或质量问题,或图像传输、图像接收产生了不确定的噪声,对图像质量产生影响。目前,主要有3 种噪声类型,即加成噪声、乘性噪声、盐椒噪声。
加成噪声一般为人为产生的噪声、自然产生的噪声、内部噪声以及在原有信号叠加的噪声。如果f(x)表示实际图像信息,f(0)表示理想的图像信息,x表示叠加噪声,那么f(x)=f(0)+x。
乘性噪声一般是由图像处理系统产生的,它是伴随着信号的变化而变化的,可能跟主板PCB 有关,也可能是CIS 传感器与其他电子元器件设计引起的噪声。按照上述定义,那么叠加噪声后信号为f(x)=f(0)+f(0)x。
盐椒噪声一般是同时存在于图像的,随机产生。高灰度图像中有低灰度图像,低灰度图像中有高灰度图像。噪声产生后需要通过对应的图像滤波方法进行处理,从而使钞票不至于太模糊或者不清晰。常见滤波方法是使像素差异较大的值更改为周围平均像素值的值。假如一个像素点比相邻的像素点值大很多,那么就可以判定该点为噪声点,此时可通过其他几个相差不大的像素点作为基础数据,取平均值后,将噪声点像素值更改为平均值,完成噪声滤波的操作。
为了能将采集图像中不必要的图像信息去掉,只留下钞票最核心的数据,必须对图像进行边缘处理[3]。对于一张图像中像素值不连续的地方,即边缘。而不连续的区域其灰度值是有变化的,例如灰度值从0 变到1,从数值看是有一个阶跃的变化,那么对该数据求一阶导数,可以发现有一个向上的阶跃。除此之外,其他数据都是0。本研究应用SOBEL 算子,主要用于计算图像亮度的梯值,其包含水平和垂直边缘检测,该算法运算时间较快,比较适用目前的设备。
将钞票放入入钞口后难免会有一些倾斜,同时设备传动机构传送时也可能会将钞票倾斜,这时就需要矫正钞票的图像处理,以便后续识别。典型的图像矫正方法有HOUGH 变换,首先计算出钞票倾斜的角度,然后将钞票整体通过一个点进行角度倾斜,最后将钞票矫正。
通过上述分析可以发现,钞票在整个处理中,不可避免地会在整个设备系统上产生一些噪声,需要对应的滤波方法除去噪声,提高图像质量。为保证钞票的完整,需要通过边缘处理的方法,最大程度地维护图片的完整性。针对设备动作、钞票运动产生的倾斜,需要通过算法将钞票矫正到最合适的状态,以便后续的钞票识别。
钞票图像识别[4]及鉴伪是钞票识别技术中最为核心的技术,需要使用各种算法、识别技术、鉴伪手段等。很多钞票的关键信息都在这个环节提取并确认,存取款一体机的核心技术也是识别鉴伪技术。
钞票面值识别[5]一般有尺寸识别、颜色识别和图像内容识别等方法,本文主要研究钞票尺寸识别方法。第五版人民币的面值有100、50、20、10、5、1 元,不同面值钞票的纸张长宽各有特征,尺寸不一,详细见表1。
表1 人民币尺寸表
通过人民币尺寸表可以看出,宽度信息具有唯一性,可以通过对钞票的图像预处理,进行图像边缘检测后,识别到每张图片的尺寸边缘,通过算法计算出图片的尺寸,通过各种不同尺寸索引到不同的面值,从而识别每张钞票的面值。
钞票识别最主要的作用是对钞票特征的获取以及模板的比对。钞票特征的获取主要是获取关键信息,以面值100 元的人民币为例,正面有100 元的标识,右上角有100 元的标识。模板的比对主要是先获取、保存正常钞票的正面信息,对新钞票进行分析时,如果是正面那么关键部分与正常钞票正面进行比对,比对一致即完成识别。如果是反面则需要进行180°的转换,以完成相应比对。通过面向识别,对后续钞票的其他信息进行识别及分析起到重要作用,例如钞票冠字号信息、重要的鉴伪信息等。
每张钞票的钞票冠字号是唯一的,是钞票的身份识别。冠字号识别[6]主要是先对钞票的冠字号区域进行识别及筛选,然后通过模板比对法进行识别。以钞票正面正向为例,冠字号在左下角区域,通过固定像素点位置坐标,即可以定位该区域。然后通过二值化的方法,将数字字母与背景进行区分,以提取到核心冠字号。提取到的字符通过与模板比对,可以计算出实际的冠字号信息。但模板比对的方法效率比较慢,如字母有26 个、数字有10 个,需要逐项比对,识别时间比较慢。可通过特征识别方法识别,通过算法快速响应,例如0,其像素特征是有闭环的圈特性;例如1,其像素特征具有宽度小,且在垂直方向上像素特性一致。通过相关算法索引可以快速检测其冠字号。
目前,钞票假币层出不穷,因此对钞票的鉴伪必不可少。常用的鉴伪方法有红外图像鉴伪方法,主要是根据钞票某个特殊图像区域或某个特殊水印位置,在可见光下和红外光下,其成像后的像素信息不同,通过其特征信息判定其真假。例如,通过红外光扫描产生的红外图像,可以发现有些钞票反面正向的图像存在,有些特征点图像已经消失。不同光下的像素信息不同,可以通过区域像素点平均值的比对判断是真钞还是假钞。500 欧元的钞票在可见光下和红外光下成像图如图3 所示[7]。
图3 可见光和红外光下钞票成像图
目前,虽然使用现金的机会越来越少,但是现金钞票在当今社会仍然不会退出舞台。不断优化完善的钞票识别设备比原来手工及最初的半自动化识别设备先进很多,同时存取款一体机已经在国有六大银行全行使用,截至目前也同步研发了多款同类产品,如大额存取款机、清分机等,都运用了钞票识别技术,使用了人工智能算法。钞票识别模块、钞票识别技术在人工智能的道路上已迈出了坚实的一步,未来将运用该技术继续推进人工智能在其他领域绽放光彩。