蔡志强
摘 要: 采用传统系统无法对辅助信息进行精准查询,导致系统无法满足人们需求,为了解决该问题,提出基于云计算的电子档案辅助信息查询系统设计。根据系统总体架构,以云计算环境为中心,设计信息存储器结构,使信息转化为内存形式,可直接被CPU访问。针对某些信息存储历史记录,设计分析处理模块接口电路,保证输入电流和输出电流具有规律性,可恢复休眠文件。根据信息分析处理结果,设计信息查询模块,保证系统设计的安全性。根据查询模块软件功能,结合档案录入流程,设计数据中心存储机制,采用面向分布式存储数据与HBase数据库,开发分布式系统查询项目,由此完成系统设计。通过实验对比结果可知,该系统最高查询精准性为98%,实现了电子档案辅助信息的高效查询。
关键词: 云计算; 电子档案; 辅助信息; 查询; 存储器; 存储机制
中图分类号: TN99?34; TP311.32 文献标识码: A 文章编号: 1004?373X(2019)11?0108?05
Abstract: The traditional system is unable to query the auxiliary information accurately, so the system can′t meet the needs of people. In order to solve the problem, the design of the electronic archives auxiliary information query system based on cloud computing is proposed. According to the overall architecture of the system, the information storage structure taking cloud computing environment as the center is designed, by which the information can be converted into memory form and accessed directly by CPU. In view of the historical records of some information storage, the interface circuit of analysis and processing module is designed to ensure the regularity of the input current and output current, and restore the dormant files. According to the results of information analysis and processing, the information query module is designed to ensure the security of the system design. In combination with the software function of query module and entering process of archives, the storage mechanism of data center is designed. The distributed storage data and HBase database are used to develop the distributed system query project, thus the system design is completed. The experimental results show that the highest query accuracy of the system can reach up to 98%, and the efficient query of electronic archives auxiliary information is realized.
Keywords: cloud computing; electronic archive; auxiliary information; query; memory; storage mechanism
0 引 言
电子档案是人们在相关活动中直接形成具有存储价值的电子化历史记录,可存储于计算机系统之中,面向个人提供基础服务[1]。由于社会的进步与经济的不断发展,电子档案数量不断增加,导致保管与查询工作量也大大增加。在进行电子档案辅助信息查询时,如果长期直接查阅原始档案,会对原始档案造成严重破坏,因此使用计算机系统进行管理,可节约档案存放时间,加快资料查询速度,进而减少工作人员的工作量,并对原始档案起到保護作用。在云计算环境下,电子档案辅助信息具有海量、异构、种类复杂、保存时间长等特性,目前尚未制定统一的数据规范,由此形成了信息孤岛[2]。
电子档案辅助信息查询系统领域里,相关学者已经做出了不少研究,针对数据之间的共享问题,提出数据跟踪管理功能,通过统一方法对异构数据源进行结构化描述,使纸质档案与电子档案并行。虽然该方法可有效解决远程需求,但针对存档备查的矛盾还无从解决,为此本文提出基于云计算的电子档案辅助信息查询系统设计。根据系统具体业务情况分析用户权限分配策略与控制访问,完善用户权限管理方案[3]。
1 架构设计
云计算是一种全新的网络服务方式,改善传统以桌面为核心的任务处理方式,转变为以网络为核心的任务处理,使用互联网技术实现信息快速传递。基于云计算的电子档案辅助信息查询系统的设计目的就是实现系统自愿扩展、统一管理和大量数据的高效查询[4]。根据大数据目标和业务需求设计该系统,具体架构如图1所示。
由图1可知:根据系统需求,电子档案查询系统必须是在云计算环境下设计的,可进行业务管理扩充以及系统存储容量横向扩充。因此,采用云计算理念设计的平台具有大容量优势,可容纳海量数据信息[5]。
1.1 系统硬件设计
根据系统总体架构对系统硬件结构进行设计,如图2所示。
由图2可知,系统总体架构由机构层和平台层组成。其中:机构层包括信息系统,这是电子档案数据的主要来源;而平台层是数据交换平台,具有基本档案服务、注册服务、信息共享服务和数据分析等功能[6]。
1.1.1 信息存储模块
传统电子档案辅助信息存储采用集中串行式存储方式,该方式存储的云环境下的大数据信息具有限制性,很难实现对云环境数据库动态数据信息的存储。云环境数据库作为系统物理存储介质上与应用相关的动态信息总和,通常以固定结构存在于介质之上[7]。
针对云环境下数据库动态信息资源的存储,应以云计算环境为中心,将不同设备连接起来共同完成信息查询,该过程需要建立数据中心,将海量信息存储在服务器之中,进而为信息分析处理提供方便,信息存储器结构设计如图3所示。
由图3可知:如果出现海量信息,信息存储时间会大大增加,那么需提高信息存储速度,保证动态信息进行存储时可节省时间,此时存储的信息可直接被CPU访问;如果存储器对信息存储速度加快,需利用内部快速转换功能,将信息转化为内存形式,此时存储的信息可被CPU访问;如果海量信息存储内存变小,需提高信息存储速度,利用相应程序将数据转换为内存形式,通过高速缓存使数据被CPU访问[8]。
1.1.2 分析处理模块
分析处理模块对系统上存在的某些历史记录进行分析,并对系统的休眠文件进行恢复处理,并为信息查询提供依据[9]。
信息查询的分析处理模块接口电路设计如图4所示。
由图4可知,该接口电路由MCS?51?8051单片机进行电流传输,由CAPI服务器进行电流传出。两个电阻分别是输入电流和输出电流的阻值,可保证电流值具有规律性[10]。
1.1.3 信息查询模块
根据上述信息分析处理结果,对信息查询模块进行设计,如图5所示。
由图5可知,当管理员想要查询电子档案信息时,需先了解管理员身份信息,验证管理员身份,确定是读者还是管理员。若是查阅者,则需了解查阅者身份信息,方便信息查询。
以云计算环境为中心设计的信息存储器结构,可节省时间,利用内部快速转换功能,将信息转化为内存形式,并直接被CPU访问;分析处理模块是对系统上存在的某些历史记录进行分析,并对休眠文件进行恢复处理;根据信息分析处理结果,设计信息查询模块,保证系统设计的安全性。
1.2 系统软件设计
对查询模块进行软件部分设计时,按照云计算网络的特点和基础结构,将系统软件功能划分成5个功能,如图6所示。
由圖6可知:通过对电子档案处理,可获取基本辅助信息,由此建立图片库和索引库,为监视与管理提供精准信息。排除对信息中心管理人员的查询,还需对工作人员、外来人员以及异地人员进行查询。从录入批量信息到获取电子档案的过程就是实现新电子档案辅助查询的过程。由于录入系统在呈现具体某个电子档案时,需先读取网页,该网页会自动打开第二个电子档案,该档案也会自动替换掉第一个打开的档案,并录取无法批量自动操作的档案。设计的档案录入流程如下:对档案进行初始化整理;打开具体档案项目;查看项目是否要保存,如果是,则需保存该电子档案;如果不是,则需查询另一个档案项目。
电子档案查询系统采用动态网页与静态网页相结合的方式,是基于云计算条件下开发的。后台数据库采用Microsoft SQL Server 2005,而中间件采用ADO.NET直接访问数据库。在系统运行过程中,管理人员可通过选择某个电子档案项目查询档案基本信息,并设置报名信息、志愿信息、体检信息等。为此,设计了数据中心存储机制,如图7所示。
采用关系数据库SQL和非关系数据库NOSQL相结合的模式对外提供存储服务,该方式利用高扩展特性,结合关系数据库存储敏感数据的优点,展示极强的数据分析处理能力。
根据存储需求,采用面向分布式存储数据与HBase数据库,开发分布式系统查询项目。为了满足辅助信息的完整性和安全性,将电子档案索引信息和注册信息全部存放于服务器之中,使用转移工具Sqoop实现关系数据和数据之间的交互功能。
利用关系数据库负责查询密集任务,MapReduce进行数据转换,通过对电子档案数据挖掘,减轻关系数据库的计算压力,由此完成系统设计。
2 实 验
采用Matlab R2000b作为实验平台,为增强结果的说服力,将传统基于Lucene的电子档案检索系统作为对比组,本文基于云计算电子档案辅助信息查询系统作为实验组,通过对比结果验证基于云计算电子档案辅助信息查询系统的有效性。
2.1 实验条件设置
分别设置单个电子档案和多个电子档案查询模式,如表1和表2所示。
由表1和表2可知,利用查询系统可获取单个电子档案辅助信息和多个档案辅助信息,但是针对该信息获取的精准性还需进行对比分析。
2.2 实验结果与分析
分别将传统系统与基于大数据系统对单个电子档案和多个电子档案查询获取的辅助信息的精准性进行对比分析。
2.2.1 单个电子档案
对单个电子档案的项目内容进行查询,该部分辅助信息的精准性在两种系統中具有截然不同的结果,如图8所示。
分析图8可知:在60 s之内,两种系统辅助信息查询精准性变动幅度都比较大;当时间超过60 s后,两种系统的变化幅度开始呈现一定的规律。当时间为160 s时,传统系统对项目1和项目2信息查询精准性达到了最低,为20%左右;当时间为100 s时,传统系统对项目1和项目2信息查询精准性达到了最高,分别为60%和56%。当时间为80 s时,本文系统对项目1和项目2信息查询精准性达到了最低,为77%左右;当时间为180 s时,本文系统对项目1和项目2信息查询精准性达到了最高,分别为96%和95%。通过对比可知,本文系统对项目1和项目2信息查询精准性高于传统系统。
2.2.2 多个电子档案
对多个电子档案的多个项目内容进行查询,分别采用传统系统与基于云计算系统对辅助信息精准性进行对比分析,结果如图9所示。
分析图9可知:当时间为100 s时,传统系统对A组档案项目1和项目2的信息查询精准性达到了最高,分别为60%和50%,而本文系统对A组档案的项目1和项目2的信息查询精准性分别为42%和45%;当时间为160 s时,传统系统对A组档案项目1和项目2的信息查询精准性达到了最低,分别为19%和10%。而本文系统对B组档案项目1和项目2的信息查询精准性在时间为200 s时达到了最低,分别为78%和83%。从图中可以看出,本文系统对项目1和项目2中的不同档案信息的查询精准性高于传统系统。
2.3 实验结论
根据上述实验内容,可得出实验结论:
传统系统无论是对单个电子档案,还是多个电子档案辅助信息进行查询,其查询精准度都较低,且最低达到了10%;而基于云计算系统对单个电子档案和多个电子档案辅助信息进行查询,其查询精准度都较高,且最高达到了98%。由此可知,基于云计算电子档案辅助信息查询系统的设计具有有效性。
3 结 语
基于云计算电子档案辅助信息查询系统主要负责沟通客户与企业,因此对其进行安全设置具有必要性。通过系统硬件实现信息安全查询,利用软件存储相关信息,为档案服务提供高效、先进的服务。
参考文献
[1] 章圣冶,罗尧治,沈雁彬.基于云计算的空间结构健康监测物联网系统设计[J].空间结构,2017,23(1):3?11.
ZHANG Shengye, LUO Yaozhi, SHEN Yanbin. IOT system design for space structural health monitoring based on cloud computing [J]. Spatial structures, 2017, 23(1): 3?11.
[2] 林静怀.基于云计算的电网调度控制培训仿真系统设计[J].电力系统自动化,2017,41(14):164?170.
LIN Jinghuai. Cloud computing based system design for power grid dispatching and control training simulation [J]. Automation of electric power systems, 2017, 41(14): 164?170.
[3] 高玉平.海量图书检索信息的快速查询系统优化设计研究[J].现代电子技术,2017,40(6):5?9.
GAO Yuping. Optimization design of fast query system for retrieval information from large amount of books [J]. Modern electronics technique, 2017, 40(6): 5?9.
[4] 班娅萌,赵月鹏,平金珍.基于云计算的分布式电源管理系统设计与实现[J].电源技术,2017,41(2):310?311.
BAN Yameng, ZHAO Yuepeng, PING Jinzhen. Distributed power management system based on cloud computing [J]. Chinese journal of power sources, 2017, 41(2): 310?311.
[5] 王晓静.基于云计算技术的迎水桥机务段生产管理信息系统设计[J].铁道运输与经济,2017,39(11):52?56.
WANG Xiaojing. Design of production management information system in Yingshuiqiao Locomotive Depot based on cloud computing [J]. Railway transport and economy, 2017, 39(11): 52?56.
[6] 杨志,顾正明.基于物联网的数字唐徕信息化管理系统设计与实现[J].节水灌溉,2017,20(1):71?75.
YANG Zhi, GU Zhengming. Design and development of digital information management system based on Internet of Things for Tanglai Irrigation District [J]. Water saving irrigation, 2017, 20(1): 71?75.
[7] 贾晓婷,邢洁清.多媒体网络信息监控与处理系统的设计与实现[J].现代电子技术,2017,40(4):57?60.
JIA Xiaoting, XING Jieqing. Design and implementation of information monitoring and processing system for multimedia network [J]. Modern electronics technique, 2017, 40(4): 57?60.
[8] 张永宏,李海峰,王麗华,等.基于嵌入式Web服务器的微气象信息远程监控系统设计[J].电子器件,2017,40(5):1250?1256.
ZHANG Yonghong, LI Haifeng, WANG Lihua, et al. Design of remote monitoring and control system for micro?meteorological information based on embedded Web server [J]. Chinese journal of electron devices, 2017, 40(5): 1250?1256.
[9] 戴闽鲁,崔丰驿,雷国平,等.基于RFID的销售管理与消费信息采集系统设计[J].现代电子技术,2017,40(9):159?162.
DAI Minlu, CUI Fengyi, LEI Guoping, et al. Design of sales management and consumer information collection system based on RFID [J]. Modern electronics technique, 2017, 40(9): 159?162.
[10] 王秋琳,宋立华,闫丽飞,等.一种非结构化数据查询优化存储系统设计[J].电子设计工程,2017,25(13):16?20.
WANG Qiulin, SONG Lihua, YAN Lifei, et al. Design of a storage system for unstructured data query optimization [J]. Electronic design engineering, 2017, 25(13): 16?20.