基于OCR技术的大学生搜题软件的开发

2018-01-25 22:52谭普阳周雅翠
神州·上旬刊 2018年1期
关键词:互联网

谭普阳+周雅翠

摘要:大学帮APP是一款帮助大学生进行自主学习、帮助教师进行学习情况管理的专门为大学学习打造的手机应用软件,它的主要功能包括拍照搜题、在线答疑、教学辅助等,其中拍照搜题功能需要借助OCR技术实现。OCR光学字符识别技术,主要包含数字图像处理、计算机图形和人工智能等方面的知识,是当前模拟识别领域最活跃的研究内容。

关键词:互联网+;APP;OCR技术;大学生人群

前言:

大学生创业主要由在校大学生或者大学毕业生组成,目前大学生就业形势严峻,很多大学生都有创新创业的想法,希望积累经验为今后走入社会、适应市场需求打下基础。

在“互联网+”的时代,随着手机,平板电脑等移动智能终端的普及,越来越多的学生成为众多使用者的一员。因而,基于移动智能终端的各种搜题APP也应运而生,这些APP的出现对教育产业产生了巨大的影响,教学辅助软件作为其中的代表越来越受人关注,我们创建大学帮APP软件目的是让学生获得一条自主学习的捷径,方便学生探讨问题,同时方便师生进行互动,提高教学质量,调动学生的积极性。

OCR技术最早由Tausheck在1929年获得专利,由于其容易接受、把握,它同语音识别、行为识别等技术一同成为人们研究的焦点。经过一个世纪的发展,OCR技术已经已经在各种领域得到广泛的应用。通常OCR识别方法可分为如下三类:统计特征字符识别技术、结构字符识别技术以及基于人工神经网络的识别技术。

软件共设有功能板块五个。一、拍照搜题功能:经过OCR技术进行图文识别,并匹配软件图库,选出正确答案解析反馈给用户。同时,设有历史搜题,关键字搜题等辅助功能,方便用户使用。二、在线答疑功能:可实现老师在线答疑功能,方便同学解决题库无法解决的问题,并设有线上沟通板块,方便老师和学生的沟通交流。三、教辅功能:实现课堂点名、课堂录像、作业提交、课表查询、课堂管理等功能。四、学习辅助功能:可实现课下自主练习,课后复习,模拟考试等功能。五、个人中心:实现个人资料完善,个人钱包充值等功能。

本软件实现拍照搜题功能主要依靠技术是OCR(光学字符识别技术)。既首先进行文字区域的定位和获取,因为文字图像的对比度较高,为了提高算法的处理速度,首先将彩色图像变换为二值图像。把边缘像素的灰度置为 255(白)其他为 0(黑)来建立高灰度对比边缘图像[1]定位出文本区域后再进行文本中行、字分割(1)行切分:文字的行与行之间都有一定的空白间隙,文本中就可以利用这个空白间隙进行行切分。(2)字切分:当行切分结束后,需要把文本行切分为单个字。在字切分中,从左向右搜索每行文字单字的左右界,切分出单字或标点符号。对汉字文本行来说,由于存在左右分离字,宽窄字,加上行中常常混有英文、数字、符号和字间污点干扰,使得字切分就比行切分艰难得多。所以字切分大抵分为两個过程,首先是求出文字、符号或部件的左右界;其次是合并部件为完整的文本汉字。[2]等运算后,将其和题库里的数据匹配,然后将正确答案反馈给用户。

市场上,已经有了很多类似的软件,而面临的问题可以理解为两个问题:有价值的信息在哪?和 有价值的信息是什么?面对这两个问题,我们需要用到版面剖析、纠偏、去噪、文字定位、切分、加强现实等技术;OCR识别除了采用传统的OCR技术之外,更多的用到目前如日中天的Deep Learning识别技术。

软件的发展前景

互联网的出现,给传统行业带来很大的冲击,但同时,也带来了新机遇。教育行业图样不例外,我们可以发现身边使用互联网获取知识,运用互联网听课的人越来越多。2015年,中国的互联网教育市场规模达到1111亿元人民币,2010-2015五年间平均复合增长率高达32.9%,Analysys易观预计2018年该市场规模将达到2680亿元人民币,将来的几年,中国互联网教育市场将保持这个增长率持续稳步发展。

本产品是面向各个高校的教辅系统,对各个高校进行教学辅助和面向大学生的移动学习平台。也是难题搜索,高效复习和师生沟通的综合学习APP。

本软件具有以下两个特点:

(1)效率。搜索技术极大的提高了我们获取信息的效率,而本软件应用的OCR技术则极大的提高我们大学生获取答案或者解决思路的效率。节省了我们通过搜索引擎搜索答案时筛选信息的时间,提高了我们大学生学习的效率。这种效率的提升不受限制,只要智能手机可以访问网络,就算没有老师的指导,你都可以高效的获取答案或者解题思路。

(2)针对性。针对性教学是我们国家教育面对的一个难题。人人都在说针对性教学,但是我们国家人口基数大,学生和老师的比例达严重失衡,很难让老师做到针对性教学。而搜题APP则很好的处理了这一点,我只搜索我不懂的,懂的则可以不必因重复学习而浪费我的时间。

总结:

国内有关的此方面的研究目前较少,我们将立足现象更进一步的研究开发力争在大学校园内广泛推广,使学校教育事业进入蓬勃发展的鼎盛期

参考文献:

[1]陈义,李言俊,孙小炜.利用 OCR 识别技术实现视频中文字的提取.西安:西北工业大学,2010.

[2]朱怀中.基于 Android 的手机 OCR 识别技术设计与实现.上海,上海天华学院.2012

项目号:2017X11025

项目名称:高校教学辅助系统的设计和开发endprint

猜你喜欢
互联网
“互联网+”环境之下的著作权保护
“互联网+”对传统图书出版的影响和推动作用
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施