电子档案长期保存中可用性保障研究

2015-05-30 10:48:04张健
北京档案 2015年4期
关键词:数据文件可用性应用程序

张健

摘要:在明确电子档案长期保存中可用性内涵的基础上,论文分析了包括物理设备风险、系统软件风险和应用程序风险等三种可用性风险,提出电子档案复制、选用自主操作系统、确定格式标准三项应对策略。

关键词:电子档案信息安全可用性

以信息技术为依托的电子档案在长期保存过程中,如何确保以可用性为基础的信息安全,是近年来档案界讨论的热点和难点问题。由于电子档案本质上是数字信息,具有信息非直读性、信息与载体可分离性、信息易变性、设备依赖性等特点,使电子档案长期保存中可用性(以下简称电子档案可用性)保障与传统载体档案相比存在很大的不同。

一、电子档案可用性的内涵

根据国家档案局《电子档案管理基本术语(征求意见稿)》,电子档案是“具有参考和利用价值并归档保存的电子文件”,因此可以认为电子档案是归档后长期保存的电子文件,针对电子文件长期保存的研究结论可以被认为适用于电子档案。

不同国家、国际组织均对电子文件长期保存进行了全面系统的研究,其中对电子文件长期保存中可用性的认识主要有:

国际标准化组织颁布的《ISO 15489-1信息与文件-文件管理-第1部分:通则》中认为:可用性就是文件应该是可被查找、可被检索、可被显示及可被说明。

国际档案理事会颁布的《电子文件档案工作者业务指南》中认为:可用性是指利用计算机技术,如硬件与软件,可以查找、定位到所需的文件,并可将文件转换成人可直读的形式,如屏幕上的文字。如果无法达成该要求,那么即使文件具有真实性和齐全性,文件内容仍然不可能被理解,即不能被利用。

国家档案局在《电子档案管理基本术语(征求意见稿)》中认为:电子档案的可用性是电子档案可以被定位、检索、呈现和理解的性质。

本文认为电子档案的可用性在于构成电子档案内容的信息经过计算机等技术设备的硬件和软件处理,能够从载体上被提取并呈现,人们能够通过视觉(听觉等)方式理解其含义。

从电子档案可用性的概念中可以明显看出,确保可用性是电子档案实现其他长期保存要求的前提和基础。如果电子档案不可用,即无法最终呈现给人们并被理解,那么诸如真实性、完整性、可靠性、及时性等就根本无从谈起,电子档案的长期保存也就失去了意义。

二、电子档案可用性的风险分析

在长期的保存过程中,存在多种风险因素可能对电子档案的可用性造成损害,这些风险因素既可以来自于自然环境,如洪水、地震、火灾等;也可能是人为的过失或蓄意,如管道泄漏、断电、盗窃、纵火、打砸等;以及电子档案所依存的信息技术的发展与淘汰等。本文从上述风险因素作用的对象角度入手分析,将影响电子档案长期保存中可用性的有关风险划分为三个层次的不同风险:物理设备风险、系统软件风险和应用程序风险。

(一)物理设备风险

构成电子档案内容信息的“0”与“1”以某种物理方式记录在载体上,通过相应的读取设备从载体上被读取。根据载体的不同,信息的记录方式也不同。目前常用的电子档案载体为光盘、硬盘、磁带等。光盘以凹坑的方式将信息记录在光盘的记录层上;读取信息时,通过伺服电机的驱动,激光头将激光投射到光盘上,通过接收到反射光的变化读取信息。磁盘、磁带等磁性载体将信息以磁信号的方式记录在盘片或带基的磁性涂层上;读取信息时,通过伺服电机的驱动,磁头掠过磁性涂层,通过感知磁信号的变化读取信息。

通过上述描述可以看出,电子档案内容信息的读取,需要载体与读取设备的良好配合,这其中涉及光、电、磁等复杂而精密的物理操作。如果载体或读取设备的物理状态发生了变化,则极有可能造成信息无法正常读取。例如载体的物理变形、磁性涂层消磁、光盘表面污损、供电失效等。造成物理状态变化的原因有很多,如撞击、摩擦、电压不稳、外界磁场等,大多可以通过技术手段减轻或避免;但随着时间推移或使用次数增加,物理设备老化(寿命终止)则不可避免,这也是物理设备面临的最大风险。

(二)系统软件风险

由于当前常用的光盘、硬盘、磁带等载体容量较大,因此单一的载体就可以存储很多电子档案。从操作系统的层面看,这些电子档案是以计算机数据文件(以下简称数据文件)的形式保存在载体上的。在具体对数据文件进行管理时,需要设计一定的规则来区分和处理载体上不同的数据文件,这就是操作系统使用的“文件系统”。以最常用的Windows操作系统为例,其在硬盘上常用的是NTFS、FAT32文件系统,如图1所示。

由于载体上的文件系统是一种数据文件的存储与管理方式,因此具有一定的操作系统独立性,即某一种文件系统可能被不同的操作系统识别并使用。但这并不表明某个具体的文件系统能够被所有操作系统识别并使用。对于操作系统不支持的文件系统,则在该载体上将表现为一片空白,无法看到(读取到)任何信息。由于光盘、硬盘和磁带使用的文件系统存在很大差别,如果未能正确地配置和使用操作系统,那么很有可能在尝试读取时遇到困难。

(三)应用程序风险

操作系统以数据文件的方式读取电子档案内容信息后,将其交给某个具体的应用程序,如Word程序,进行显示和编辑。不同的数据文件以文件名中的扩展名进行类型(格式)区分,如“.DOC”为Word程序专用的数据文件。电子档案使用不同的应用程序处理,将保存为不同格式(扩展名)的数据文件。

一般而言,较为复杂格式的数据文件(.TXT这种简单格式的除外)都存在与编辑处理该类数据文件的应用程序的对应关系。由于常用的应用程序大多由专业软件公司研制开发并进行升级维护,出于商业利益考虑,软件公司不会将应用程序的源代码公开,因而一旦软件公司破产倒闭甚至主要开发人员离职,使应用程序将得不到正常的维护升级,进而影响到该程序专用格式数据文件的处理。

另外还有一种与格式相关的风险,即电子档案的内容被加密或压缩。被加密或被压缩的电子档案内容已经变成了普通应用程序(如Word程序)无法直接打开显示的乱码数据文件。如果解密软件(包括密钥丢失)或解压缩软件无法正常解密或解压缩电子档案,则该电子档案将无法被还原而成为“死档案”。

三、电子档案可用性保障策略

电子档案存在的可用性风险应当引起档案工作者的高度重视。针对上述风险,本文认为可以综合采用以下几种技术方法进行应对:

(一)电子档案复制

针对电子档案可用性面临的物理设备风险和系统软件风险,最好的应对措施是进行电子档案复制。

电子档案的载体及读取设备本身存在物理寿命及技术寿命。物理寿命指的是载体及读取设备的性能随着时间的推移和使用次数的增加不断衰减直至完全终结;技术寿命指的是新技术载体和读取设备出现后,老的载体及读取设备被技术淘汰。由于信息技术发展速度非常快,多数情况下载体及读取设备的技术寿命短于物理寿命。由于电子档案的载体及读取设备属于复杂精密的光、电、磁设备,其维护保养的复杂度和难度远远大于传统档案载体(如纸张),加之技术寿命短,因此制造能长期(几十年甚至数百年)使用的电子档案载体及读取设备的难度极大。

但应当看到,电子档案的数字信息特征使其具备信息与载体的可分离性,即信息不再依赖于载体,进而电子档案的真实性、完整性、原始性等维护措施与传统档案依靠维护载体的原始性达成同样目标的方法有了很大的区别。在可控的环境下依照严格的程序,适时将电子档案从原有载体上复制到新的载体上,可以规避载体及读取设备的寿命风险。

(二)选用自主操作系统

由于文件系统风险与所使用的操作系统密切相关,因此最佳应对方案是能够研发设计并使用自主操作系统。

尽管国外商业化的操作系统如Windows的新版本在很多功能上具有向前兼容的能力,如对文件系统的处理上,最新的Windows10也能正确读取Win? dowsXP甚至更早的Windows98、Windows3.1等版本所使用的“古老”的FAT/FAT32文件系统中保存的数据。但由于Windows的版权以及内部核心代码均由国外公司掌握,因此不排除今后的某一天未来的Win? dows的新版本将不再支持FAT/FAT32文件系统,从而导致使用Windows新版本时无法读取保存在硬盘上FAT/FAT32文件系统中的电子档案。

自主研发全新的或改进开源的操作系统可以确保针对所需要文件系统(如FAT/FAT32)的正确读取。具体方法可以将其中针对不同文件系统的数据文件读取功能以模块化方式挂接在操作系统中。针对用户实际使用的载体情况,由操作系统自动判断其文件系统,调用相应的读取模块读取电子档案;或者由用户手工选择操作。FAT/FAT32等文件系统的技术细节已经不再是秘密,因此该方案的实施具有很强的可行性。

(三)确定格式标准

针对用于打开、显示(播放)电子档案的应用程序风险,当前国内外档案界比较认可的解决方法是将电子档案以某种不会过时(即现在和将来的应用程序都能打开)的数据文件格式保存。

国家档案局制定颁布的《DA/T47-2009版式电子文件长期保存格式需求》正是应对这一问题的解决方案。该标准中明确列出了对数据文件格式的要求,即格式开放、不绑定软硬件、文件自包含、格式自描述、显示一致性等共11项具体的要求。但该标准并未给出哪些计算机数据文件格式符合上述11项要求,即未推荐具体的数据文件格式用于电子档案的长期保存。

国际标准化组织发布的《ISO 19005-1:2005文件管理-电子文件长期保存文件格式-第一部分:使用PDF 1.4 (PDF/A-1)》以及后续PDF/A-2和PDF/A-3构成的完整PDF/A已经被众多国际组织及国家所接受。PDF/A相对于其他格式标准具有以下优势:首先完全符合DA/T47-2009;其次作为ISO标准,其技术支持和维护具有可靠保障;再次采用这一国际标准将有利于我国档案工作对外交流合作。

对于多媒体类(如音频、视频等)的电子档案,目前尚无国际或国内的正式数据文件格式标准,但若干技术组织或企业制定的标准基本上成为了事实上的应用标准。国内档案界亟须尽快形成自己的意见,确定所需的数据文件格式标准。

此外,为避免处于加密或压缩状态的电子档案由于无法解密或解压缩而带来保管和利用上的不便,应当确保电子档案去除所有加密和压缩,以便直接打开使用相应的常规应用程序。

参考文献:

[1]张正强.论电子文件长久保存基本要求体系的建立[J].中国档案, 2010(3):61-64.

[2]崔屏.电子文件凭证性溯源及内涵研究[J].档案与建设, 2013(9):4-7.

[3]冯惠玲.电子文件管理:信息化社会的基石[J].电子政务, 2010(6):3-9.

猜你喜欢
数据文件可用性应用程序
基于文献计量学的界面设计可用性中外对比研究
包装工程(2023年24期)2023-12-27 09:18:26
基于辐射传输模型的GOCI晨昏时段数据的可用性分析
删除Win10中自带的应用程序
电脑报(2019年12期)2019-09-10 05:08:20
数据文件恢复专题问答
数据文件安全管控技术的研究与实现
SQL数据文件恢复工具
空客A320模拟机FD1+2可用性的讨论
河南科技(2015年7期)2015-03-11 16:23:13
黔西南州烤烟化学成分可用性评价
作物研究(2014年6期)2014-03-01 03:39:04
Tekla Structure数据文件交互格式分析
关闭应用程序更新提醒
电脑迷(2012年15期)2012-04-29 17:09:47