刘娜
(西安航空职业技术学院 人工智能学院, 陕西 西安 710089)
快速发展完善的大数据、云计算、物联网等现代技术为社会各行业信息化水平的提升提供了强大的技术支撑,近年来电子文件成为信息流的重要载体,促使数字档案信息呈现指数级增长,受到技术、管理等多种因素的交叉影响,传统针对纸质档案以人工操作为主的管理方法导致数字档案的完整与安全面临着较大的威胁,已经难以满足数字化档案的管理需求,作为信息资源的重要构成,数字档案资源安全成为信息安全方面的关注重点,因此,如何有效掌控并化解数字档案资源管理风险成为领域内的一项研究重点,设计并实现数字化档案安全管理系统用于电子档案的存储、管理及使用是本文的研究重点。
数字化档案是实现档案交互共享的基础,而数字化档案离不开相应数字化管理系统的支撑。不断投入应用的现代化新技术包括大数据、人工智能等在内为数字档案管理带来了新的挑战,促使档案信息化建设不断深入,数字档案资源数量随之快速增加,使许多潜在的新型风险隐患日益突出,各类数字档案资源面临着不同程度,包括人为风险等在内的安全威胁,数量不断增加的数字化档案对档案管理提出了更高的要求。关于数字化档案管理系统实现的关键技术方面的研究取得了一定的进展,例如,梁静等提出的基于Web技术的档案管理系统的设计方案,石俊萍等提出的基于用户自定义结构的数字化档案管理系统的设计与实现。目前数字化档案的安全管理系统化的研究成果及投入实用的方案较少,针对数字化档案的安全性问题,部分学者如李明华提出了数字化档案安全的重点关注问题以及档案安全体系建设与不断完善,王霞提出了一种全文加密的安全保护方法为数字化档案提供了更加科学有效的安全保密措施[1]。本文在现有研究基础上,根据重要及敏感档案的安全管理需求,设计了一种数字化档案加密安全系统,通过多种安全技术的综合应用设计并实现了高安全性数字化档案管理系统的主要功能模块。
分析目前主流的数字化档案系统发现其存在的主要安全风险表现在:档案失密泄密风险,包括计算机、服务器等在内的档案系统的载体是确保数字化档案安全的基础,现有的档案管理系统大多以明文存储模式为主使获取存储于载体中的档案信息的难度较小;档案管理系统的用户管理风险,其他人在泄露账号和密码的情况下能够直接登录该系统并执行相关档案操作;系统面临着黑客攻击、破解、用户误操作等导致的受损或丢失风险。因此,本文在构建数字化档案加密安全系统时提出了有针对性的安全保护方法:(1)通过调用加解密插件实现档案的落盘加密存储,并加密处理数据库,在数据库中存储档案对应的文件元和用户信息,档案和数据库的信息查看和获取操作只能通过该系统完成。(2)采用三权分立的用户管理模式(包括普通用户、系统和数据管理员),系统管理员可查看用户操作日志,不同用户的系统操作权限不同。(3)采用双因子认证,在持有USB-Key 的同时需输入正确口令才能成功登录系统,每个用户有三次口令输入权限,超过3次将被锁定,从而有效防止了暴力破解口令问题。(4)操作审计,生成审计信息(不可修改删除),系统可自动审计数据管理员和用户的关键操作信息,包括用户登录及访问信息、档案操作情况(如检索、调阅、增删查改)等。(5)档案备份和恢复,设置定时和手动两种备份功能,对于受损的档案信息可使用一键恢复功能[2]。
本文所设计的数字化档案加密安全系统的整体架构示意图,如图1所示。
图1 系统总体架构示意图
该系统主要负责实现导入档案数字化文件、档案查询、用户及系统综合管理等功能,扫描文件后提取元信息,生成相应的文件元信息和数字化文件,再经加密后导入系统,并分别在本地数据库和本地文件库中存储。该系统主要由系统管理、档案信息导入、档案管理,包括档案检索和调阅的档案利用几个功能模块构成,进一步实现了对档案类别目录的定义以及档案的增加、修改、删除等操作[3]。功能模块如图2所示。
图2 系统主要功能模块构成
2.2.1 系统管理
系统管理模块主要负责实现操作审计、用户认证和管理功能,通过双因子身份认证后的用户即可登录系统,通过用户名、口令和USB-Key身份认证(提供了 USB 接口)确认用户身份,使用强双因子认证模式(一次一密),有效提高了档案加密安全系统的安全性能。采用三权分立的权限设置方式区分用户身份,面向三种角色即普通用户(具备查看及检索加密档案的权限)、系统管理员(主要负责完成针对数据管理员和普通用户的管理以及用户的操作审计)和数据管理员(主要负责导入、校对档案,确保数字档案同元信息相对应等操作)。系统自动审计数据管理员和普通用户的操作,并提供用户全生命周期管理。系统管理员可查看其他用户的操作日志[4]。
2.2.2 数字化档案信息导入
数字化档案信息导入可单个或批量导入文件元信息和数字文件,去除文件元信息中的重复和冗余数据并经加密处理后存储到数据库中,导入的数字文件落盘即为密文并在客户端本地保存。仅数据管理员具备数据导入权限,系统会对导入的文件元信息进行有效控制(包括格式、类型、长度等),提示存在的冗余及错误信息,确保导入信息的准确性;导入数字文件并建立其与文件元信息间的关联(一一对应),数字化档案提供的加解密插件(提供密钥管理、加解密引擎、算法扩展、密文信息管理等丰富功能)可由上层应用开放接口调用,在此基础上完成有针对性的加密处理(同时确保数据可以被解密),数字档案不以明文形式存储,从而实现文件落盘加密[5]。
2.2.3 档案利用
档案利用主要包括档案管理、检索和调阅,数据管理员完成对档案信息的增删查改等操作,系统支持密文文件档案调阅并提供调阅界面,档案按照特定方式分类分级,档案检索是帮助提高用户的工作及使用效率的重要手段,针对系统导入的落盘加密数字化档案采用密文检索技术实现准确高效的检索过程,支持四种检索方式:(1)浏览检索,提供向导式检索,在检索过程中逐层深入查找,按照层级关系罗列的档案信息直至找到所需档案,支持文件元信息树状结构组织,帮助用户完成快速检索过程。(2)高级检索,用户可根据元信息中包含的条件使用多重逻辑检索方式,并可自定义逻辑条件实现快速定位。(3)一体化检索,可快速完成数字档案文件元信息(包含检索字段)的检索过程。(4)检索结果再检索,检索过程对应着数据库查询,为有效展示查询结果各检索方式需转换为统一数据库语句。系统运行时加密档案解密可供有权限的用户进行解密查看,并在退出后自动清除明文缓存[6]。
目前已有的包括AES、RSA、ECC等在内的加密方法(保护用户数据隐私的常用方法)虽能够对用户隐私数据提供一定程度的有效保护,但要求具有足够长的密钥,随着云环境应用的普及,存储于其中的加密数据面临着难以使用云环境中计算资源处理加密数据的问题,传统加密方法大多不支持对加密文件的模糊检索及运算功能[6]。
3.1.1 KEDWBF 定义
KEDWBF定义为KEDWBF=(Init,Enc,Ret),由3个算法组成:(1)初始化算法,std表示代价标准的二维数组;p表示该文件的误检率;gi(x)表示值域均为[1,m]的模拟函数;nmax表示DWBF的元素个数上限;pmax表示用户允许的最大误检率;dj表示查询失效代价,包含k个哈希函数;h1()和 h2()表示独立的哈希函数;key表示关键字加密的密钥,位数组BF包含m 个元素,初始化算法Init:{p,m,k,BF,gi(x)(i ∈[1,k])} ← Gen(nmax,pmax,dj,std,h1(),h2(),key)。(2)关键字加密算法,E 表示一种确定的加密算法,Enc:i 文件的关键字集合 KWi= {kwi1,kwi2,…,kwiy},BFi← Enc(BFi,gj(x)(j ∈[1,k]),key,E,KWi)。(3)检索算法,Ret: File_ID ← Ret(BF1,BF2,…,BFt,E(kw))[7]。
3.1.2 算法描述
加密后的明文关键字通过KEDWBF映射为BF并将其作为文件的关键字存储,在此基础上实现高效的模糊检索,对加密算法和检索算法即Enc()和Ret()[8]的描述如下。
(1)Enc(),由h1()和 h2()表示基本的哈希函数(如MD5和SHA-1),通过确定的加密算法E的使用完成对档案关键字的加密处理,具体算法如下。
输入BF、key、KWi={kwi1,kwi 2,…,kwin},初始化BF使其元素的值均为 0;
For j=1 to n do
en_ kwij=E(kwij,key);
v1=h1(en_ kwij| |i);
v2=h2(en_ kwij| |i);
For z=1 to k do
pos=v1+z×v2+z4mod BF length;
BF[pos-1]=1;
End For
End For
return BF;
(2)Ret(),以检索包含关键字kw的文件威力,r表示用户可检索的文件数对应BF={BF1,BF2,…,BFr},查询失效代价集合DJ={dj1,dj2,…,djr}。用户发送检索请求前,加密kw得到密文en_ kw=E(kw,key)并发给SP,SP通过Ret()算法检索数据库,具体算法[9]如下。
输入:BF,DJ,en_kw,std
For i=1 to r do
判断i文件的查询失效代价级别t,计算该文件需要的独立哈希函数个数 k以及对应的误检pi=pmax(2-t);
tag=0;
v1=h1(en_ kw||i);
v2=h2(en_ kw||i);
For z=1 to k do
pos=v1+zv2+z4mod BFilength;
If BFi[pos-1]! =1 Then
tag=1;
break;
If tag= =0 then
第 i 个文件符合要求;
Else
第 i 个文件不符合要求;
End If
End For.
按照上述设计方案开发出的数字化档案加密安全系统的用户操作流程,如图3所示。
图3 用户操作流程
用户认证界面,如图4所示。
图4 用户认证界面
系统管理界面(主要用于用户管理和操作审计),如图5所示。
图5 系统管理界面
数据管理员在档案管理界面完成档案管理和检索。根据《数字化档案管理系统基本功能规定》以PDF导入数字化档案文件,元信息以excel 表的形式存储,并和数字化文件同时导入,系统所有操作均有详细说明,符合用户操作习惯,在保证数字化档案安全的同时显著提高了档案的管理质量和效率,具有较高的实际应用参考价值。
本文以数字化档案安全管理中存在的主要问题为依据,并基于实体档案的管理和利用流程,设计了一种数字化档案加密安全管理系统,结合运用USB-Key认证、数据库及文件加密、关键字加密等技术有效提高了数字化档案的安全管理和利用质量与效率,实现了对数字化档案资源的高安全性管理功能,可有效满足企业及机关对重要档案的安全管理和使用需求,使办公效率得到显著提高。