计算机视觉和基于数据库的搜索算法的研究

2018-01-25 22:50牛俊哲周雅翠
神州·上旬刊 2018年1期
关键词:计算机视觉互联网数据库

牛俊哲+周雅翠

摘要:“大学帮”使大学生方便快捷通过搜素的完成线上查题及寻找教辅资料,进而帮助学生完成学业任务,使其更加轻松、快捷、有效地掌握所学的知识。

关键词:互联网+ ;APP;计算机视觉;数据库;算法

前言:

随着智能手机的快速发展和“互联网+”概念的降生,众多教育机构以app为载体发展了非常多的在线教育产品,只有成功切中用户体验和用户迫切希望的功能且使用体验足够便捷的产品才有可能成功,而在其中最重要的技术便是搜索所使用的各种技术,一个准确而快速的搜索可以更为有效的增加APP的用户体验和稳定用户数量。

项目需求分析

经过了互联网多年的发展,搜题类APP已经发展了多套可行的发展模式,但是由于大学生的课程多而杂,始终没有一套完整的模式来针对大学生使用,大学帮很好的弥补了这一缺点,与高校合作后拥有多级分类学科和题库,能够更为准确的为不同专业学生打造不同体系的测试题库。

重点使用技术分析

主要用到了计算机视觉,关系数据库中的关键词查询结果动态优化,ORC识别等相关技术。

计算机视觉是一个让计算机如何像人类一样“看世界”的现代科学技术,更为详细的说,就是是指用摄影设备和电脑代替眼睛对目标进行识别、跟踪和测量等机器的视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。一个计算机视觉判定一组图像数据中是否包含某个特定的物体,图像特征,基于此,能够分析出目标图像中大量公式和字符,并根据算法加以排列成你所需要的文字题。但是根据文献调查,计算机视觉技术的最重要的问题便是视觉问题复杂性的本质在于对所见相对图像的描述与识别,视觉信号充满了非常丰富的信息,描述起来也更加困难。

比如,很多图像中蕴含了大量复杂的图片数据,如何攻克信息提取过程中的各种难题一直是现在计算机视觉的难题。在各种各样的复杂的算法模型中,基于概率论和数理统计的数学模型是最适合解决布满文字以及公式图像的工具。

计算机视觉里经常使卷积神经网络技术,这是一种对二维图像的滤波操作,也是对人脑比较精准的模拟。卷积就是两个函数之间的相互关系,通过这个函数关系,可以获得一个新的值,然后在连续空间内做积分的计算,最后在离散空间内求和的相对过程。在计算机视觉里面,换句话说可以把卷积当做一个把视图抽象出来的过程,就是把一小片区域内的信息统计并抽象出来。比如,对于一张计算机收到的图片,我可以使用n个不同的卷积和函数对这个图片里的任意区域进行抽象和 统计。也可以用不同的方法进行统计,比如重点统计中心区域,也可以着重统计边缘区域,这就导致统计抽象的和函数的种类非常多,为了达到可以同时学习多个统计的累积和。

在关系数据库数据结构中,数据存储的“关系”描述了数据可的组成对象以及对象间的联系,具有规则的数据结构类数据通常被称为结构化数据。针对存在于关系数据库中的结构化数据,可以借助于数据可管理系统DBMS中的各项功能(比如数据操纵功能DML)和搜索算法来查找满足特定要求的查询目标集合。在最通俗易懂的sql查询语句中,最简单的关键词查询语句为selec列1,列2,列3from表名where name like'%關键词%',但想要根据用户的查询兴趣获得更快更具有效率的查询则需要算法对查询进行动态优化。

蚁群算法是一种模仿自然界蚂蚁搜索食物的行为所受启发研究出来的智能进化算法,可以用来在图中寻找优化路径。简单点说就是蚂蚁之间利用信息素沟通来互相调整路径来达到一个最佳路径,获得路径的最优解。使用基于蚁群优化算法的ACOKS算法来帮助用户解决关键词查询问题不但可以获得非常好的性能还能在后续修改函数工作中获得更大的便利。但是ACOKS算法无法解决查询结果的动态优化,面对庞大查询结果量,用户很难在短时间内做出判断。所以进一步提出结合概念飘逸理论的优化算法ACOKS,实现查询和查询结果的动态优化。

在日常生活中,用户查询的兴趣有时候会突然发生变化,所以不能继续使用长期的概率统计来查询数据。于是出现了概念漂移,概念漂移是指数据随着时间和用户需求变化而发生变化,这些变化就使得原来的数据模型已经不能很好的适应新的数据分布。所以要对模型进行更新。基于概念漂移的查询结果动态优化方法的核心思想是利用概念漂移理论及时发现用户查询兴趣的变化,并根据这些变化来动态优化查询结果,使结果更加符合用户查询预期结果。具体来说,利用概念漂移理论确定用户的兴趣集合,以后只要对ACOKS算法做简单修改就可以得到新的ACOKS算法。从而使得查询结果当中出现更多的兴趣节点集中的内容,更加符合用户兴趣。

总结:

本文主要针对搜索所使用的识别技术和关系数据库搜索的算法进行研究和探索,为软件提供了更为快捷方便的搜索提供了基础使得查询结果更加符合用户的预期,保证了查询结果的有效性。

参考文献:

[1]《关系数据库中的关键词查询结果动态优化》 作者:林子雨,邹 权,赖永炫,林 琛

[2]《计算机视觉核心技术现状与展望》 作者:许志杰,王 晶,刘 颖,范九伦

项目号:2017X11025

项目名称:高校教学辅助系统的设计和开发endprint

猜你喜欢
计算机视觉互联网数据库
危险气体罐车液位计算机视觉监控识别报警系统设计
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施