基于AE调整CMOS成像系统的研究与实现

2011-12-31 00:00:00林旭晞
电脑知识与技术 2011年29期


  摘要:针对目前市场上点读笔实用性方面的不足进行改进,提出了设计Auto Exposure自动曝光算法,提高获取图像的质量,从而能够减少重复获取图像的时间和误码率,提高点读笔的识别成功率。
  关键词:点读笔;光学字符识别;Auto Exposure;自动曝光
  中图分类号:TP391文献标识码:A 文章编号:1009-3044(2011)29-7269-03
  1 概述
  1.1 光学字符识别技术概述
  光学字符识别(OCR)技术,是指使用电子设备扫描文本资料上的字符,通过检测图像上明暗确定其形状,然后用字符识别方法转化成计算机内码,从而获取文字及版面信息的过程。[5]
  在信息技术高速发展的现代社会,计算机强大的处理数据能力与低效的数据输入之间的矛盾愈发明显。将记录在纸上的文字图像信息输入计算机是件非常繁重而缓慢的工作,是当今信息技术发展的瓶颈之一。光学字符识别技术的研究与开发正是基于这样一个社会背景,成为解决计算机强大的处理数据能力与低效的数据输入之间矛盾的有效手段之一。在当今市场上已经有了不少字符识别系统产品,但实现的方式和识别成功率还有不小的发展空间。巨大的市场需求是OCR技术存在和发展的主要动力,因此OCR技术的研究和开发具有重要的价值和意义。
  如何提高识别率,是OCR技术最关键的课题。OCR技术可以说是一种不确定的技术研究,正确率就像是一个无穷趋近函数,知道其趋近值,却只能靠近而无法达到,永远在与100%作拉锯战。[5]影响识别率的因素纷扰繁杂,印刷纸的品质、印刷的品质、扫描仪的扫描品质、识别的算法、测试的样本等等,都会影响其识别率。因此,OCR技术的产品除了需要有一个强有力的识别算法外,产品的操作使用方便性、所提供的除错功能及方法,亦是决定产品好坏的重要因素。
  衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。[7]
  1.2 点读笔的应用背景和研究目的
  据专家实验证明,学习中完全靠听可以记住内容的34%;完全靠看可记住内容的70%;听与看相结合,可记住内容的95%。因此,使无声教材发声,是加强记忆提高学习效果的高效方法。
  点读笔是光学图像识别技术的新一代高科技产品,采用OID (Optical Identify)隐形码技术,将电子新科技与图书紧密结合在一起,研发出有声图书系列。它是继学习机、点读机之后的新一代教育学习工具。点读笔利用数码发声技术对传统图书的一次整合,在图书中加入了声音,极大提高了图书阅读的有趣性及丰富性。点读笔小巧方便,即点即发音,它将声音加于枯燥的文字之上,使图书内容更丰富,使阅读和学习更有趣,可充分实现寓教于乐。[8]
  在国外,点读笔的使用较普遍,特别针对学龄前的儿童设计,有着广泛的市场认知度。但在我国,点读笔的使用还未被大众了解和接受,其中存在的问题包括识别系统的开发相对滞后、产品设计不够完善、产品包含的教学内容较少等等。
  在本文中,将针对点读笔的原理和使用特点,重点考虑通过算法提高识别成功率,使孩子更容易使用点读笔。
  2 点读笔原理分析
  2.1 点读笔的组成和工作流程
  一套完整的点读笔产品由一把点读笔和配套印刷品组成,其中点读笔主要由红外感光功能的笔头(Sensor)、MCU (Micro Control Unit)、存储器、按键、喇叭、电池仓、插口组成。
  点读笔的笔头是一个带有CMOS摄像头的传感部件,主要作用是采集点读对象上的信息。点读笔的拒识率、误识率、识别速度等很大程度上由摄像头的质量决定。
  点读笔工作流程是由Sensor获取图像,判断图像亮度是否合适,如果不合适将重新抓图,如果合适将进入OID(Optical Identification)隐形码解码,得到对应码值,最后根据码值找出对应音档并播放。
  2.2 点读笔的两个关键技术点
  在点读笔工作流程中,有两个关键技术点,一是OID隐形码方案,二是会反射红外光的特殊涂料印刷。
  OID(Optical Identify)是一种光学辨识码。OID搭起了印刷物与数字系统之间的接口桥梁。OID方案是点读笔的核心,包含专用的光学笔头模块与影像译码芯片。每组OID编码图形均是由近似等灰度且肉眼难以辨别的点依特定规则所组成,对应一组特定数值。与其他光学辨识码相比,OID编码最大的优点是微小化的底码,不仅具有较高的保密性和低视觉干扰特性,更能隐藏在传统的CMYK印刷品的彩色图案下。[9]
  CMYK也称作印刷色彩模式,是一种依靠反光的色彩模式。普通印刷品只需要用CMYK即可调出需要的各种颜色,但点读笔所用到的特殊涂料印刷品需要在此基础上增加一种会吸收红外线的黑色,即K',K'是利用CMY调试出的不含碳的K。暗码层,即点像层,是用K'印刷的极细的OID编码图形点阵图像,近似等灰度,肉眼难以辨别,每组图形对应OID编码中一组特定数值。
  如图2中所示,当LED灯投射红外线时,点像层中的K'吸收红外线,其余红外线穿透普通CMYK印刷INK,被纸张表面反射,最终Sensor将接收到的是点阵图像,如图3。
  在之后的程序效果测试中,我们将对比由CMOS镜头获取的点阵图效果,以检验新设计程序对点读笔的拒识率、误识率、识别成功率产生何种影响。
  2.3 OID方案的比较分析和研究切入点
  当前,市场上,市场上主要生产芯片和提供OID方案有四大厂家,四家产品各有优劣,不同OID方案实现的码量、允许的读取角度、视觉干扰率、误码率和工作照度不尽相同。
  当前OID应用上的缺陷及不足主要表现在:
  1)有的方案应用完全没有考虑Sensor的成像效果会由于外围环境(如纸张的材质、码点印刷的质量、工作环境照度等因素)、点读笔的倾斜角度等的不同而产生差异;
  2)有的方案商虽然考虑了外围环境造成的影响,但调整及校正的机制粗犷,缺乏通用性,只能在某些特定点读笔产品中得到良好成像效果。
  以上这些因素造成成像效果差的结果,对OID识别算法提出更高要求,而对算法的要求过于苛刻,会最终影响识别率。OID识别算法发展至今已经较为成熟,对该算法进行进一步改良的难度高,代价也重。在不对OID识别算法进行改良的情况下,若对硬件设备提出高要求,将大大提高点读笔的生产成本。权衡利弊之下,如果能提高Sensor的成像效果,之前提到的难题将迎刃而解。
  同时,考虑到点读笔产品的操作使用方便性,点读笔的实际使用对象是学龄前的孩子。目前市场上的产品大都要求在一定照度下,将点读笔垂直于纸面并紧贴纸面才能正确识别并发音,但小孩子不容易做到。使用手握点读笔的方式进行点读,很难保证孩子能像大人一样快速准确地使用点读笔。如果孩子觉得使用困难将会很快对这样的产品失去兴趣,昂贵的设备也将成为摆设。
  在传统点读流程流程中,若一直未能获取合适亮度的图像,会导致多次反复抓取图像,从而大量增加识别时间,并且可能最终识别失败。由此,我与共事的技术人员在传统点读流程的基础上,增加了一个全新的环节,如图5,这个环节将针对成像效果进行改良,在不改变OID识别算法和硬件设备的条件下降低拒识率和误码率,提高点读笔识别正确率和点读笔在实际使用中允许的读取角度。
  3 AE算法的实现方案设计与实现
  
  3.1 程序设计流程
  本文针对前面提到的OID应用上的缺陷及不足,对Auto Exposure自动曝光(简称AE)算法进行设计与研究,重点考虑亮度、笔与纸面倾斜角度以及笔在纸面投影方向等对CMOS镜头成像的影响,通过算法提高点读笔的识别正确率。
  根据点读笔的工作原理,AE算法的流程表述如下:CMOS镜头抓图后,判断图像亮度是否合适,若否针对图像亮度进行曝光时间的增减并进行重新抓图;若“是”则进入OID解码模块。
  当工作照度过高过低或孩子拿笔的倾斜角度过大时,获取的图像质量差,通过改进AE算法保证让中央区域的图像在一定范围的倾角及LED照度内,都能获取到亮度和清晰度合适的图像。
  在整个流程中,需要考虑并解决的问题有:
  1)在测光过程中对比两种不同的测光方式的优劣和算法代价;
  2)在计算图像亮度的过程中,提高计算亮度的算法效率;
  3)通过肉眼判断和实验结果确定目标亮度值;
  4)确定增减曝光时间,保证响应时间。
  3.2 程序测试
  通过专门仪器对点读笔进行测试,记录在一定照度下,测试用点读笔处于不同位置的识别情况。具体测试次数、平均响应时间、拒识率、误码率、成功率如表1。
  在加入Auto Exposure自动曝光程序前,点读笔在0度夹角时笔头贴近纸张测不到数据;在30度夹角时有较好的识别成功率;在40度夹角时拒识率和误码率明显增加;在50度夹角时受外部因素影响太大,成功率偏低而且不稳定,不满足产品要求。
  在加入Auto Exposure自动曝光程序后,在0度到40度夹角之间的测试拒识率、误码率大幅减少,识别成功率均可到达100%,将点读笔的稳定使用夹角从一般产品的30度-40度提高到了40度以上;同时,在50度夹角时,识别成功率也表现良好。
  4 结束语
  光学字符识别技术的应用有着很高的市场价值,点读笔作为光学图像识别技术的新一代高科技产品正逐步为人们所熟知。Auto Exposure自动曝光算法对改进该产品有着明显的效果,有效地降低了拒识率和误码率,提高了识别成功率并且增加了点读笔在实际使用中允许的读取角度,更有助于孩子对点读笔的使用及产品的推广。
  参考文献:
  [1]