钱江+宋艳+黄慧+郝自飞+程翔
【摘要】 “大数据”是近两年来各界最热议的话题之一,与“大数据”相关的实践几乎成为所有行业在技术和商业两个方面最具创新意义的行动。可以说,数据的有效利用是每个企业高效运作的基础。在当今信息爆炸的时代,随着移动互联网、云计算、物联网的发展以及视频监控、智能终端、应用商店的普及,信息每天都在以惊人的速度增长,种类也在不断扩展,越来越多的非结构化数据开始涌现。本文分析及探讨了无障碍免接口模式大数据采集方法。
【关键词】 无障碍 免接口模式 大数据采集方法
一、无障碍免接口模式大数据采集的优势
当今社会,是信息化高速发展的时代,而数据已经渗透到各个行业及业务职能领域,成为极其重要的生产因素及动能,人们对海量数据的挖掘及利用,也就说明新一波的生产率在不断上升。在我国数据呈现出不断增加的状态时,这对数据抓取及信息采集的相关产品来说,不仅是机遇更是挑战,相对的采集产品的数量也就逐渐增加,虽然人们能够看到采集产品广阔的发展前景,但是产品质量却难以达到高品质、高要求标准,而无障碍大数据采集系统与其他产品相比,却存在一定的技术优势:首先,无障碍大数据采集系统能够以用户需求为基础,根據用户自定义的任务配置及概念设定,进行相关网页及关键信息的高效抽取,精准定位应用程序中的半结构化与非结构化数据,在经过加工及处理后,就可以在一定程度上优化数据记录结构,从而使结构化更加清晰、一致,从而以最简化的形式将采集任务存储在数据库中,不仅可以为内部使用提供便利,更能实现信息的高速传播及共享,确保信息能够在短时间内完成无障碍获取。其次,对用户使用资质并不更会做出高标准要求,即使是对IT一无所知的业余人员,也可以在不经过任何专业讲解及学习、不需要与被采集系统的开发商进行业务联系、更不需要在被采集系统的开发商提供技术文档的情况下,就可以通过系统设定信息及指示进行自由操作,快速获取有用信息,在这一过程中不仅信息操作流程更加简单,用户更可以运用自然语言与系统进行相互交流及信息沟通,在遵循基本原则的基础上,可以在本系统以外的其他连接系统中进行不同信息的收集。最后,无障碍大数据采集系统内设运行规则灵活多变,可以服务于各个种类的网站,有助于他们建立友好连接,实现信息的高效采集。同时系统中自带的解决方法具有快速反应、无需人工启动的优势特点,该方案可以在对自然语言充分了解的基础上,利用解析内核,精准定位用户需求信息,并以此为依托,对信息内容进行处理,在结合概念引用的相关中提炼出有关动态及时态的量化信息,为用户的畅快使用带来前所未有的无障碍体验。
二、无障碍免接口模式大数据的采集方法
无障碍大数据的采集系统可以通过规则治理系统的管理及控制,在各个时段对云系统中的大数据设置具有规划性质的大数据采集虚拟终端。在此背景下用户可以将虚拟终端看成是能发挥职能作用的工作人员,为了便于进行操作及管理,则需要在信息采集系统中为假定的工作人员注册专属的员工个人账号,而设备的登录规则与员工登录基本一致,也可以输入设备账号进入不同的系统,根据数据的传递及处理要求进行相关操作。产品结构如图1所示:
业务流程模拟引擎能够对不同的用户在系统中的使用状态及访问系统的环境进行模拟,而虚拟用户的操作行为及过程则会记录在模拟用户行为集中。模拟用户行为集的产生需要依托于真实用户的行为录制模块,该模块不仅能够对模拟用户的行为集进行记录,更能推动模拟用户行为集的运行,在使用前者时,可以发挥其参考及指导作用,并且该模块还能够掌控行为集的运行状态及所处环境。行为录制模块及正常工作期间,该模块不仅能够对客户机进行监督及控制,更能掌握用户的信息应用指令,对服务器产生的用户信息进行实时记录,这样当虚拟用户与服务器进行相互联系及请求处理时,客户机接口就可以在不需要依托系统资源的前提下进行操作。与此同时,每个工作站都可以容纳并运用多个虚拟用户,而业务流程模拟引擎的工作量也不会相对增加,只需要进行简单的操作及处理,就可以进行大型、巨量的数据抓取。除此之外,模拟用户行为集的运行及功能发挥,并不需要与客户机软件建立联系,这样如果在客户机软件的用户界面发生改变及应用功能并不完善的情况下,虚拟用户检测服务的功能及优势发挥也不会受到任何阻碍。
综上所述,无障碍免接口模式的大数据采集方法不仅能够快速实现数据之间的交换及采集,更能提升数据采集的安全性及稳定性,在强化人机互动的基础上,使大数据的采集更加便利及智能,为用户打造更加自动化、信息化的IT基础平台。
参 考 文 献
[1] 韩霄汉,黄金娟,孙钢,谢烽.基于采集大数据的拆表止度自动复核模式探索[J].浙江电力,2016(35).
[2] 徐剑.大数据时代图书选题信息的采集模式研究[D].安徽大学,2015.