陈汉华
关于使用高清摄像头进行自学考试电子档案采集的研究
陈汉华
本文主要介绍了当前电子档案图像管理的方法,分析了旧的电子档案图像管理模式的缺陷,具体阐述了如何将电子档案图像存储到数据库中并通过数据库对电子档案图像进行管理。介绍了这种新的电子档案图像管理模式的优点、对软硬件的要求,以及具体的应用策略。
电子档案;高清摄像头;条形码
自学考试电子档案管理系统是将考生的纸质档案材料通过扫描的方式转为电子图像的形式,通过磁盘的方式进行存储,并在此之上进行开发相应的系统进行管理。福建省于2000年上半年开始在福州试点考生考籍档案管理的电子化改革,经过近3年的探索和实验,不断总结经验教训,不断完善,于2003年下半年开始在全省推广该项改革,时至今日,已经基本将全省所有在籍考生的纸质档案扫描成电子图像格式的文件,基本实现了考生考籍档案的电子化管理。并在此基础上建立了省级的考籍数据库和电子档案图像库,自行研制开发了一系列相关的考籍管理软件,搭建起从省自考办到各市、县(区)自考办的考籍管理工作平台。
目前考生的纸质档案采集是分四步:首先对每张要扫描的纸质材料打印条形码;整理纸质档案材料并贴上条形码;由扫描人员在客户端使用高速扫描仪扫描纸质档案,扫描仪在扫描的同时识别条形码;最后由分发人员在管理端对扫描生成的图像进行校验,根据条形码识别结果对图像文件进行命名后再分发入库。
目前自学考试电子档案的图像采集设别主要是高速扫描仪,用该设备采集电子档案图像具有以下几个优点:
1)采集速度快。普通高速扫描仪以柯达I260为例,在采集A4幅面的纸质材料时能达到30张/分的扫描速度。
2)生成的图像文件小。同样以A4幅面的纸质材料为例,在黑白模式、200DPI精度扫描生成的TIF格式图像一般在80K以下。
3)条形码识别率高。
4)软硬件技术成熟,应用时间长、范围广,方便进行二次开发。
但是,福建省在多年的扫描实践过程中也发现使用高速扫描仪采集电子档案存在以下缺点:
1)高速扫描仪价格昂贵,维护成本高。普通高速扫描仪价格均在10万元左右,每年的维护费为1万元/台。
2)扫描仪容易损坏。高速扫描仪一般是采用进纸的方式进行扫描,容易吸入各种杂物,引起损坏。而且长期使用容易造成机器过热,需要定时关机冷却。
考虑到电子档案采集实际上就是一个纸质档案电子化的过程,如果我们使用摄像头,对准固定的位置进行实时监控,以一定的时间间隔对监控画面进行采样,对采样的画面进行分析(识别条形码),如果识别出条形码则说明当前位置上是一张试卷,然后我们就可以对采样的画面进行相应的图像处理(如纠正、去黑边、二值化等)后保存。这样电子档案的采集就可以由一人在固定位置不断放置试卷,由计算机自动进行识别并保存。
要使用摄像头采集电子档案图像,必须具备以下几点要求。
硬件方面:
1)摄像头必须具备高清录制的功能,以保证能采集到足够大幅面的图像并保证采集图像的清晰度。
2)摄像头必须能够自动对焦,以减少手工对焦的操作。
软件方面:
1)程序能够控制摄像头以一定时间频率进行采样,一般通用的摄像头开发控件无法提供这项功能,必须自行开发。
2)程序要求对图像中的条形码有较高的识别率,这样才能保证电子档案图像采集的速度。
3)程序应控制好采集图像文件的大小,以免图像文件过大影响存储及查询的性能。
使用摄像头采集电子档案图像,相对于扫描仪具有以下优点:
1)成本低廉。普通高清摄像头成本在500元以下,且基本上无须维护。
2)体积小,方便携带。
3)持久耐用。摄像头可以进行长期视频监控,不会发生设备过热的情况。
4)操作方便。由于高清摄像头具有自动对焦的功能,因此我们仅需要固定好摄像头和被采集物体即可,其余操作有程序在计算机后台进行。
为使摄像头能够以较高的频率采集的足够清晰的电子档案图像,我们采用了目前市面上通用的高清摄像头,具体产品规格如下:
品牌:达见faceVsion
传感器:CMOS
核心光学镜头:1G4P+IR,视角:78.1°
视频分辨率:最大分辨率1280×800(MAX)
内置H.264压码智能芯片
最大帧数:16:9 HD(1280×720)为22帧,其他分辨率下(WVGA,VGA,QVGA,CIF)为30帧
由于目前的摄像头驱动程序只能实现WVGA(640×480)模式的视频采集,因此我们以WVGA模式对电子档案图像进行采集,该模式下摄像头最大帧数为30帧/秒,所以只要我们将采样时间间隔控制在1/30秒以上就能保证图像采集速度。
通过程序调用WINDOWS API函数,以TIMER控件控制采样频率,我们实现了控制高清摄像头实施监控并采样。
首先,我们要能够对图像中的条形码进行识别。目前流行的条形码种类繁多,为方便描述,本文我们以CODE128码为例,CODE128分三类,即128A,128B,128C,以黑白间隔不同宽度的线条进行编码。我们必须先在图像中找到条形码,然后识别出黑白线条的宽度,并与标准CODE128字符表进行比对,找出对应的字符。具体事项方法如下:
1)首先,我们要对图片进行处理,把它转换成黑白图。Y=0.299×r+0.587×g+0.114×b这个公式是RGB色彩中亮度的贡献参数计算方法。也是常用的RGB转灰度图片的计算公式。我们定义一个阈值来判定到底是黑还是白,经过实践发现192这个值比较合适。所有Y小于192的判断为黑,其余为白。
2)获取条形码的粗细信息。一个纵向的循环,计算出每一条竖线到底是黑线还是白线,同时记录出连续有多少黑线和白线,单位是像素。这样,我们就可以把图像转换成我们需要的特征数据了。
3)将这些数据转成我们要的结果。我们可以采取一种基于对比的匹配算法,这种方法可以容许较大的误差。我们只要将采用的结果和标准表进行对比,取方差最小的为结果就可以了。经过实践证明,此算法的确有较高的识别能力。
然后,我们要对采样图像进行测试,判断摄像头能够在多远的距离识别出条形码。经过测试我们发现,摄像头对距离10cm左右的试卷进行监控采样时,能够比较准确的识别出条形码。这个距离下采样的图像如图1。
图1
我们可以看到,该距离下摄像头仅能采集到试卷图像的一小部分,无法达到电子档案图像采集的要求。考虑到目前的试卷均为A3幅面,如果我们能够对较小幅面的笔迹卡(一般为B5幅面)进行图像采集,并增大条形码的幅面,这样摄像头采集到的图像就能够达到电子档案图像的要求。
在进行程序开发时,我们开发了三个类模块:classImage Process、 class Video Capture、 class BCRead,分别实现图像处理、摄像头控制、条形码识别。具体程序界面如图2。
图2
随着图像识别技术的不断发展和日益成熟,高清摄像头的应用前景也越来越广泛。如面部定位,面部识别,笑脸快拍等,这些技术目前已经广泛地应用于数码相机中,我们也可以将它移植到高清摄像头中,并应用到自学考试管理。如在新生报名摄像时,我们可以预先设置好背景,打开摄像头进行实时监控并以一定时间频率开始图像采样,当有考生进入监控范围并将面部对准摄像头时,程序就可以在采样图像中定位到面部图像,并对该图像进行一定处理后保存下来。这样就可以实现新生报名时自动采集相片,大大提高了报名的速度。我们还可以将高清摄像头应用于考场,利用面部识别技术对考生进行识别,通过与考生相片库进行比对,以防止替考情况的发生。
[1]Kalen Delaney.SQL Server 2000技术内幕[M].北京:电子工业出版社.2005:206-300.
[2]微软公司.Programming a Microsoft SQL Server 2000 Database[M].北京:清华大学出版社.2002:300-350.
[3]微软公司.创建和管理WEB服务器[M].北京:北京希望电子出版社.1999:110-190.
The Research of Store Electronic Documentary Image Files with Database
CHEN Hanhua
This article mainly describes the current method of the electronic documentary image management,analysis the shortcomings of old electronic documentary image management model,describes in detail how to save the electronic documentary image in database and manages the electronic documentary image through database.It describes the merits of this new model of electronic documentary image management,demands of software and hardware,and its material application strategy.
Electronic Documentary;Image;Database
G405
B
1005-8427(2012)04-0039-4
福建省高等教育自学考试委员会办公室