刘昕宇
(南宁市第三中学,广西南宁,530000)
随着科学技术的发展,人工智能中的图像识别技术已被广泛应用于人类生活中[1]。人工智能中的图像识别技术已成为信息技术发展的重要标志,在信息发展中占有重要地位。图像技术作为重要的发展研究项目引入工业智能,科学科学研究中国对未来发展有着良好的期待[2-3]。智能图像识别技术融入工作中,智能图像识别技术正处于中国科技时代,在快速发展的同时,也必须关注智能图像识别技术的技术原理和生活中图像识别技术的应用[4-5]。人工智能图像识别技术的关键要素是图像模式识别,模式识别不仅是图像识别原理的重要组成部分,也是人工智能技术的组成部分[6]。模式识别主要应用于处理不同类型的平面和立体图像以实现图像和实体分析的图像处理技术。由于图像识别技术主要使用人工智能来协调虚拟物体的分析与模式识别,物体的分析不再需要面对真实的物体,人工智能和模式识别可以使图像立体化[7-8]。
机器视觉技术当下应用广泛,其包含计算机科学,人工智能、电子信息等[9]。它通过相关设备将摄取的目标转换成图像,再由专门的图像处理系统进行分析,从而得到数字信号指挥现场设备进行运转。其不仅能很好的模拟人眼视觉,且能执行人类无法完成的高精度任务[10]。
纠错,顾名思义,是将错误的题目重新纠正,便于之后复习时能更快找到之前出错的题目,以防止相同的错误重复出现。纠错过程中,需要学生将待纠错的题目誊抄到笔记本上,并且有时候还需要摘抄部分的参考答案。因此,在纠错过程中会产生大量需要抄写的字符。得益于纠错的方便快捷,可以随意记录错题与笔记,随时随地都可以复习,以及其较强的可操作性、效率高等优势,纠错开始成为一种主流的学习方法。
当前,中学生的学习开始趋于追求更高效、更方便的学习方式、学习方法,纠错慢慢为大多数的中学生和老师青睐。而在纠错的过程中,大学多数的学生面临着同样一个问题:进行纠错时需要摘抄题目,而题目常常配有大量文字和符号,摘抄时费事费力,而且容易抄错。可以在摘抄时极大限度地解放双手并且进一步提高效率,能方便学生的学习和人们的日常工作。目前,国内许多办公软件和手机系统附带有文字识别功能。诸如此类的软件一般较好地完成对清晰、干净、简单资料的文字识别,并将其转换成为电子版。但是,一旦出现大量文字和符号时,对于结构复杂、生僻字以及特殊符号等的识别速度和准确的便大大降低,甚至会出现乱码。而机器视觉的题目符号智能识别系统能提高识别的准确度和稳定性,提高字符识别质量。
因此,提出了一种机器视觉的题目符号智能识别系统,该系统能够较好的进行题目符号的识别,并且正确率高,稳定性强。
该系统主要包含硬件和软件两个部分,其主要工作的原理是:首先,当图像传感器被激发之后,会向相机发出指令,相机接到指令后,进行图像的采集,即题目字符等图像的采集,采集结束之后,图像会被送到题目字符检测系统,系统通过所开发的题目字符信息特征识别算法完成对题目字符的自动识别和检测。系统框架图如图1所示。
图1 系统框架图
针对待测字符的特点,本次研究我选取了MER-201-25GM工业相机,它的帧率为20fps,由于彩色图像的灰度值相差较大,处理起来比较麻烦,所以我采用了黑白的工业相机,它能够快速的对字符进行识别检测。
图2 工业相机
型号为MER- 2 01 - 25GM的工业相机的感光曲线特性图如图3所示。
图3 感光曲线特性图
镜头方面我选择了型号为AFT-0614MP的100万像素的工业镜头,因为所测字符位置为平面,该镜头能够更好的满足要求。图4为研究所用工业镜头。
图4 镜头
如图5是型号为AFT-0614MP的100万像素的面阵工业相机的MFT曲线特性图。
图5 MFT曲线特性图
摄影是光的艺术,由于拍摄环境的不同,为了保证拍摄需求,需要使用光源来保证拍摄环境。由于纸张表面光滑且反光,所以此次研究我选择了条形红光光源来配合图像采集。它的灯带角度为45°,能够较好的抑制从纸面反射光,获得高质量的图像。同时它也能够使拍摄周围的光照环境更符合要求。
图6 条形光源
传感器是一种检测装置,能够将接收到的信息,转换成电信号,在题目字符识别系统中,使用了采集触发传感器和图像处理器,能够将接受的字符信号进行处理。各传感器的选型及参数如表1所示。
表1 硬件型号与参数
软件处理部分如图7所示,主要工作流程是:传感器接收到信号之后,相机开始采集图像,并将采集之后的图像进行预处理,输入到字符识别检测系统,系统在进行完一系列工作之后,输出显示结果。
图7 软件框架图
研究所用系统是基于软件开发平台,结合OpenCv开发的不同学科不同题目类型的多种题目符号融合的图像处理算法嵌入在题目符合智能识别系统里面。通过该系统,我们可以对多种题目符号融合的试卷题目进行实时信息采集,首先设置好相关的参数,然后再打开相机进行实时的图像采集,采集后的图片经过处理后被输送到字符检测系统中,字符检测系统将处理之后的结果显示在操作界面上。
图8 显示界面
能够快速实时的对多种字符符合融合的题目符号进行识别和检测,并将识别检测结果实时反馈到控制端,辅助进行纠错,显得尤为重要。无论是数学学科的题目,还是物理等其他学科的题目,都会有2种或2种以上的字符符合融合而成,这些因素都会给检测带来一定的难度。现利用系统来识别两批相同数量的题目符合图像,在相同环境的情况下进行对比试验如表2所示。
表2 试验数据
系统识别了两批相同数量的50张题目符合图像,然后在同样的环境下进行了6组识别试验,从表中数据可知,识别一批的误检率大致在4.0%内,比较稳定,识别二批的误检率在8.0%以内,且比较稳定。识别所用时间在110s以内,识别效率较高。
此次研究,我设计出了一款基于机器视觉的字符智能识别系统,该系统能够针对不同学科多种字符进行识别检测,展现了较好的性能。软件系统识别检测所用时间均在110s以内,且误检率在8%以内。表明该检测系统可以高效、实时的完成对不同学科、多种字符符合融合下的题目符合特征的识别和检测。实际推广应用价值大,市场前景广阔。