一种可供识别和溯源的印章图像核验系统

2022-06-02 06:35蔡旖旎陈正鸣倪佳佳
计算机与现代化 2022年5期
关键词:盖章核验印章

蔡旖旎,陈正鸣,倪佳佳

(河海大学信息学部物联网工程学院,江苏 常州 213022)

0 引 言

印章是具有法律效力的信用传递的标志,是权力的重要象征。印章的使用距今已有3000多年的历史,它是传统中国文化的重要符号。而印章的使用非常广泛,在中日韩等众多亚洲国家均有广泛的使用,同时在各类企事业单位特别是金融行业中起到重要的信用身份作用[1],每个实体业主至少需要4~5枚印章,国内的印章存量就达到3.5亿枚以上。

正因为印章在社会活动中的重要信用身份,与印章相关的经济纠纷案件屡有发生,仅关于公章,我国每年造成的直接经济损失就高达1274亿。随着科技进步,犯罪分子伪造印章的手段变高明,成本变低[2];部分企业缺乏对于印章的管控,印章易被盗用冒用;同时,传统的印章鉴别真伪程序繁琐而周期冗长,不能及时辨别印章的真伪性[3]。因此设计一款鉴定印章的专业辅助系统有着重要意义[4]。

自20世纪80年代起,国内外学者就开始借助计算机图像处理技术解决印章自动识别的问题。传统的印章自动识别方法通常可以分为2类:基于不变特征的印章识别方法和基于配准的印章识别方法。基于不变特征的识别方法无需对印章细化定位配准,避免了引入配准误差,如Fourier描述子[5]、小波分析[6]、Delaunay三角剖分[7]、图像的不变矩[8]等方法经常被用作不变特征的提取,但这类方法识别率有待提高,往往对比较细微的差异不够敏感。

基于配准的印章识别方法占多数,这类方法通常将待测印章图像与预留印章图像配准后,提取印章图像的特征进行分类识别。国内比较知名的有:胡庆等人[9]提出的基于启发式知识的印章识别方法,引入了待测与预留印章图像之间的“差图像”,借助“真差”“假差”表现出不同结构信息,再结合统计模型的决策方式进行判决,但此方法对配准的精度要求很高;高文等人[10]提出的基于边缘特征的识别方法,将印章图像摆正到水平位置,再通过提取印章笔画位置、笔画粗细等细节特征,对比这些特征的相似程度来识别印章的真伪,这种方法是拓扑结构与统计方法的结合,有一定适应性,但是由于利用单像素边缘重合点直接匹配,所以墨迹深浅对笔画粗细易产生影响。近年来,也出现了通过文字识别[11-12]的方法进行章型识别。

在移动互联时代,在当下流行的智能印章基础上本文提出一款集管控、识别、溯源为一体的印章管理和核验系统[13-14]。系统引入神经网络提取印章的特征,避免了传统手工特征提取时存在的配准精度等问题;实现基于神经网络的章型识别方法,有较好的分类准确率和较强的鲁棒性,并行处理能力强;引入基于孪生网络的印章图像溯源方法,能够追溯到印章具体的某次盖章和对应的盖章时间,从而判别印章图像的真伪性;同时建立智能印章的管控系统,通过系统管控智能印章并记录盖章行为。

1 系统总体设计

本文的解决方案涵盖了智能印章的主要功能,并具备用印管控、印痕溯源、印章防伪等特色,通过印章智能化、平台一体化实现对使用人员和印章使用的管控,能记录和管控用印的行为,通过盖章获得的印章图像进行章型识别和印章溯源。

系统的总体设计如图1所示,包括印章终端、客户端、云服务器,以文件的印章图像作为介质进行识别。

图1 系统总体设计

1)终端:物联网智能印章终端。印章内置特殊油印,利用了紫外荧光防伪技术,通过智能印章内部的摄像头拍摄得到印章图像,一次拍摄2种形式,白底的普通样式和紫外光下蓝底的特殊样式,在盖章的同时作为依据保存。该物联网智能印章通过软件系统管控,不被授权则不具有盖章功能,同时实现了采集操作行为数据的功能。

2)服务器:采用云服务器。对于客户,服务器能存储和处理客户对各个印章终端的操作数据,提供计算服务,用于图像处理功能进行章型识别和印章溯源等;对于章企,能够提供系统管理、安全管理等系统服务,用于登记管理客户信息、更新印章信息、处理异常行为等;对于企业管理人员,通过访问服务器进行印章信息的管理和授权。

3)客户端:手机APP和PC客户端。其中手机APP是物联网智能印章终端的主要操作控制台,授权印章终端的盖章和核验溯源操作;同时提供管理和查询服务,能进行用印的权限设置和关于印章的操作记录查询等。而PC客户端则主要面向企业印章管理者、制章企业使用,主要进行系统维护、终端印章管理、用户信息管理和操作信息管理等。

整个系统实现了印章信息的闭环,是一个完整安全的解决方案:不仅完成了对智能印章终端的有效管控和记录用印过程,同时对已盖的印章图像拥有完整的辨别手段。整个用章权限呈现出一个层次关系,从企业审批用章权限到用章人员申请使用,大大减少了盗用、非法使用印章的可能性。

除此之外,相比于传统的印章使用模式来说,智能印章终端保留了传统印章的使用方法,并实现机构内部印章管理,同时具备随手鉴别盖章图像信息源头的功能。这个模式下,将印章数据和数据处理的工作交给后台,管理员和用章人员使用客户端进行操作,这种前后台分开的使用模式,优势是巨大的,保证了印章使用管控的安全性,简化了盖章图像鉴别的繁琐复杂流程,节省了非必要的人力消耗。

2 系统关键技术

2.1 章型识别

章型识别需要识别出印章的种类,即当章面文字和章面形状符合时,能够判断为印章图像是某个实体印章盖章所得[14-15]。

深度卷积神经网络的兴起,为计算机视觉领域带来了突破。2016年,He等人[16]提出了ResNet,其被广泛应用到多个领域,获得了良好效果。该网络通过网络架构设计缓解了卷积神经网络深度增加导致的梯度弥散和梯度爆炸问题[17],同时加深了网络深度,优化了系统的准确度,是深度学习里程碑式的工作。深度残差网络主要利用了恒等映射,它保证了深层网络的性能至少不会比浅层网络差。假设某残差单元的最优映射函数为H(X),但H(X)不容易学习得到,因此提出残差单元将该映射函数改写成H(X)=F(X)+X,逼近残差函数F(X)等效于求得H(X),ResNet相当于把学习目标改变了,目标在学习输出和输入的差别。若F(X)=0,就成了恒等映射。

残差网络在前馈网络中添加短路链接“shortcut”,实现残差映射[18]。基本的残差块结构单元如图2(a)所示,短路链接能通过不同的步长,跳过一个或多个层,直接汇入主径。图2(b)和图2(c)为残差块的2种结构。网络不会引入额外参数,增加计算复杂度。

图2 残差块结构单元

若残差单元的输入量x和输出量y的维度相同,输出公式为式(1);若输入和输出维度不同,在短路连接上增加一个线性投影WS,输出公式为式(2),其中函数F(x,{Wi})表示为学习到的残差函数[19]。

y=F(x,{Wi})+x

(1)

y=F(x,{Wi})+WSx

(2)

本文采用50层的深度残差网络[20],网络输入端通过卷积核、批标准化和最大池化层,将特征输入到16个残差模块中。网络主要使用了4种输出通道大小不同的残差单元结构,每个单元结构中都采用了3层卷积操作,同时使用多个小卷积核而避免使用一个大的卷积核,借助于多个非线性激活函数ReLU,增加网络非线性能力,简化求导过程,降低了深度残差网络模型的计算量。网络输出端通过全局平均池化层和1000个神经元的全连接层,并使用激活函数softmax将输入数降低为输出类别数。图3为网络的整体结构。

图3 ResNet50网络结构图

2.2 印章图像溯源

印章图像溯源主要是在后期核验印文时,通过待核验印章图像的本身的特征,对比得到盖章图像库中符合条件的图像,从而识别出印章的具体身份,即印章是某次盖章所得,从而返回核验图像的盖章时间和对应的盖章信息[21]。

印章在使用过程中,由于盖印方式、纸张粗糙程度不同,使印章印文具有露白特征,露白特征的形成有一定的随机性[22],印文本身有差异,同时盖印的文件背景也不相同,所以能追溯每枚印文的源头。

印章印文溯源就是度量图片之间的相似程度,确定待测印章图像为模板图像,根据模板图像识别待匹配模板,即盖章时备案的图片。

孪生神经网络的输入是图像对,输出是图像对的相似程度。网络从数据中学习自动度量相似程度的方法,从而能判别目标是否相同,在单样本学习上有一定的作用[23]。孪生神经网络的架构如图4所示,左右2路分支的结构一致,共享权值W,F(X)为特征映射函数,将输入样本X1、X2映射到目标空间[24],从而度量两者的特征相似程度。

图4 孪生网络结构图

DW是网络的输出,对于同类样本,DW的值越趋近于1;对于不同类样本,DW的值越趋近于0。因此在训练样本时,图像对为相同类别样本时,标签y的取值为1。2个样本间特征的欧氏距离表示为样本之间的距离DW=‖F(X1)-F(X2)‖2。采用对比损失函数,用于判断样本对内在类别的差异。损失函数定义如下:

(3)

L((X1,X2),y)(i)=(1-y)Ld(Dw(X1,X2)(i))+

yLs(DW(X1,X2)(i))

(4)

其中,L((X1,X2),y)(i)表示第i对样本与标签y所得的损失,而Ls表示样本类别相同时的损失,Ld表示样本类别不同时的损失。孪生网络能够在不提供具体类别的条件下进行特征学习,通过网络对样本进行特征表达,最后计算特征向量间距离与阈值的关系判定结果[25-26]。

3 系统设计与实现

3.1 数据集

数据集直接影响着实验的结果。本文使用的自建数据集中,通过终端统一采集盖章图片的数据,其中包括7个样本的9514张图像,实验中使用该数据集作为残差网络的数据集。另外使用5种章型的450枚不同盖章印痕,采集了5000张图像,作为孪生神经网络的数据集。终端使用统一的摄像参数,采集照片的模式分为紫光和白光模式,紫光模式下图片为蓝底红章,模糊了背景信息,突出印章印文本身特点,应用于章型识别;白光模式下图片为白底红章,保留背景文字,加大类间差异,应用于印章溯源。

如图5(a)所示为紫光和白光模式下获取的同枚印章同次盖章的原始图像数据,图像存在较多留白。将原始图像裁剪保留下主要的印章和背景信息,作为数据集图片5(b)。

(a) 原始图像数据

(b) 数据集图片

3.2 算法测试

本文实验的硬件环境是超微SYS-7048GR-TR服务器,挂载3块NVIDIA TITAN X的GPU卡;深度学习框架使用TensorFlow2.0.0。

在验证章型识别算法过程中,主要通过图像的准确率评价该分类模型应用在印章数据集上的分类性能。准确率指的是正确预测的样本数量与总样本数的比值。如图6所示,章型识别的准确率随着迭代次数增加,很快上升并趋于稳定,验证识别准确率为99.28%。

图6 章型识别中准确率随迭代次数的变化

验证印章溯源算法中,图7展示了随着迭代次数的增加,网络的损失逐渐下降,网络在验证集上的准确率不断上升,利用早停法,网络训练在第80次停止,网络达到了94.68%的准确率,网络模型趋于稳定,性能不变。

图7 印章溯源中准确率随迭代次数的变化

3.3 数据库设计与实现

在系统的实现中,数据库是支撑系统运作的关键,Oracle数据库在各类管理系统中被广泛使用,可以为印章业务数据提供稳定安全的环境。本文使用Navicat对Oracle数据库系统进行管理[27]。

由于平台需要支持企业信息管理、用户信息和用户权限、印章信息以及运行时产生的运行数据如盖章信息和核验信息,为此需要设计不同的数据库表,降低数据间冗余,建立用户信息、印章终端信息为主实体,印章授权信息、印章盖章信息、印章核验信息等为子类型实体。

3.4 系统实现

印章核验系统在技术架构上总体上分为5层:视图层、服务器代理层、控制层、服务层、数据访问层、基础设施层。

APP客户端使用Restful架构风格[28]。针对网络应用的开发方式,降低了开发的复杂度,提高了系统的可伸缩性。使用Activity组件和Fragment,主要是实现软件界面和用户交互,从而处理用户需求。终端和移动端之间基于WIFI Direct建立连接,进行数据传输通信,移动端和服务器端的交互采用HTTP协议,数据传输主要使用Json方式。

系统后台使用Spring Boot框架和MyBatis。Spring Boot框架[29]简化了Spring应用的搭建和开发过程,去除了大量的XML配置文件,简化了复杂的依赖管理,适合构建微服务系统。MyBatis能够与Spring很好集成,对不同的数据写不同的SQL,应变能力较强,这与Hibernate的全自动化较为不同,对SQL的优化更为简便。

3.5 印章管控和核验流程

印章管控和核验系统的流程如图8所示。

图8 印章管控和核验流程图

1)用印人员的身份信息和用印权限需要提前申请,经过申请审批之后才能获得使用对应终端操作的权限。

2)用印操作全程受控,终端的盖章和核验功能需在客户端上操作后才能使用,仅获得权限的用印人员才能操作对应终端,用印行为全程记录。

3)盖章操作时,能够对盖章图案实时备案,将盖章所得印痕和文件部分背景上传至数据库进行备案。

4)核验操作时,对所需要核验查证的盖章图像先进行章型识别,判别出合法的章型类型,若章型类别不存在,则返回重新核验;识别出盖章图像的对应章型后进一步进行溯源查证,查证该盖章图像的状态正确与否、使用时间和使用对象等信息,实现用印追查功能。

3.6 效果展示

印章采集和核验一体化的智能终端,主要由回墨印章、采集模块、控制模块、通信模块组成。未使用时,印章于印章收纳盒中良好保存。

回墨印章内置印盒,通过按压的方式,翻转印章,完成盖章和蘸墨2个过程。终端内置的采集模块包含摄像头、白光LED灯、紫外光LED灯,用于盖章和核验时对印痕的采集。控制模块根据APP的指示信号控制印章能否接触纸面。通信模块保证了终端与智能手机之间的信号和印章图像的稳定传输。图9为盖采一体化印章智能终端。

图9 印章智能终端

核验印章时,利用终端对准已盖的印章进行采集,采集待核验印章图片后进行章型识别,识别出结果后返回识别值。选择正确章型,若为终端授权盖章并采集的合格印章,返回结果为验证成功,并返回相应的盖章信息,如图10(a)所示。若非终端授权盖章,私盖的印章图像,核验结果为错误,如图10(b)所示。

(a) 验证成功 (b) 验证失败图10 印章核验结果界面图

经过一段时间的测试,收集到588条不同类型的印章盖章图像,通过人工对检测结果进行校验,印章核验系统的得出准确率如表1所示。

表1 印章核验系统测试结果

4 结束语

本文根据现代实体印章管理的实际需求,设计实现了一种管控、识别、溯源于一体的印章核验系统。该系统能够对智能印章的使用者和权限进行管控,同时能完成盖章与核验一体化的功能。将神经网络引入到印章的识别和核验的过程中,设计和实现过程中兼顾了准确率和运行效率,为印章图像的防伪流程提供了新的思路。

猜你喜欢
盖章核验印章
自动盖章机的结构设计*
我们有印章咯
“盖章”
2020年度新闻记者证核验人员名单公示
停下!请接受身份核验
爱盖章的国王
《中外玩具制造》编辑部2020 年度核验新闻记者证公示名单
日本“防狼印章”半小时售罄
印章
一种翻页盖章装置