北京市档案馆档案数字信息资源业务全流程管理研究

2015-05-15 08:52:03张勇
北京档案 2015年2期
关键词:数字信息档案馆载体

张勇

摘要:在大数据时代的背景下,档案馆出现新的工作重心,主要是对档案数字信息资源的管理。其业务全流程包括:档案接收、档案数据管理、档案数据存备、档案数字信息资源利用等,本文以北京市档案馆为研究对象,对综合档案馆档案数字信息资源业务全流程管理进行了探讨。

关键词:档案数字信息资源档案工作业务流程纸质档案数字化副本

当今社会在大数据时代的背景下信息技术飞速发展,为档案数字信息资源的管理和传播提供了便利条件和技术手段,同时也使其面临诸多挑战。电子档案的大量产生,以及馆藏档案数字化进程的加速推进,使北京市综合档案馆档案数字资源以惊人的速度增长,数据量级将完成太字节(TB)向拍字节(PB)的迈进,档案工作本身也相应产生变化:档案实体的管理与档案数字资源的管理正逐步分离,传统的档案实体将更倾向于充当异质保存的角色,而档案数字资源的管理则将逐步成为档案工作重心。如何对档案数字信息资源开展全流程管理,克服相关管理中存在的问题,是摆在档案工作者面前的新课题。本文选取在业务特性、数据规模都具备代表性的北京市档案馆作为研究样本。

一、档案数字信息资源业务的全流程管理

档案数字信息资源业务全流程管理涵盖档案接收、档案数据管理、档案数据存备、档案数字信息利用等主体业务环节的规范管理。综合档案馆对档案数字信息资源开展全流程规范管理,具有以下几个方面的意义:

(一)提高档案数字信息资源的质量、增加数量

档案馆和利用者都渴望大量的数字资源可供利用,档案数字信息资源业务流程的管理带来数字资源的规范化,将使档案馆可以按照同样的标准和质量进行组织加工,加工速度也得以提高。

(二)增强专业化协作,减少浪费、增加实效档案数字信息资源业务流程管理的规范可以减少资源加工过程中的重复性工作,从而减少不必要的重复劳动,将复杂的问题简单化,充分利用前人的劳动成果。数字档案资源管理业务流程的规范为档案馆的管理提供了条件。在档案馆内各部门之间,通过技术、管理和工作的规范,管理得以正常实施。另外,使档案馆管理与档案馆外部协作得以顺利实现。专业化协作是社会生产组织的先进形式之一,是生产社会化和生产分工的产物。专业化把社会生产分解为各个独立的生产部门,而协作又把被分解的各个部门联结成为有机的整体。专业化协作的条件是规范化。没有统一的规范,专业化协作无法进行。

(三)促进世界档案信息技术标准建立,促进档案信息技术进步

数字档案资源业务流程管理的规范一旦实施,一定会产生必要的技术规程或标准,同时促进档案信息技术的进步。

二、北京市档案馆的相关管理现状和主要问题

目前,北京市综合档案馆缺乏针对档案数字信息资源的全流程管理规范。

(一)档案接收

现状:北京市档案馆目前采用离线方式接收电子档案,使用光盘、移动硬盘作为接收载体介质。接收文件类型多样,包含电子照片、电子文档、程序文件、网站系统、办公系统、音频视频文件、多媒体文件等。档案进馆时与立档单位办理档案移交手续,进行数据校验、核对数目、介质查杀病毒、介质可读性检验、文档打开检验、音视频随机播放检验等。

主要问题:北京市档案馆因为没有用于在线接收的软件平台,数据校验之后,接收进馆的检索目录和电子文件没有进入系统,而以光盘载体形式存放,并且没有元数据采集和著录交接信息,利用方式为档案光盘调阅。

(二)档案数据管理

现状:北京市档案馆纸质档案数字化副本可以在线查询,电子文件不封装,数据按照明文方式存储。

主要问题:北京市档案馆接收的电子档案全部处于应用系统之外,不能在线检索利用;档案馆应用系统在档案数字资源凭证性保障功能方面空缺;档案馆应用系统没有馆藏档案数字资源统计报表模块,统计仍然依靠手工方式进行。

(三)档案数据存备

现状:北京市档案馆采用在线、近线、离线备份策略,分别对应本地、同城、异地三级数据备份。接收电子档案载体存放于专用防磁库房,介质包括光盘、移动硬盘等。

主要问题:缺乏电子档案的定期检查和销毁机制。

(四)档案数字信息资源利用

现状:北京市档案馆采用三种方式提供档案数字资源利用和信息发布:一是内部数据专网提供电子档案载体介质调阅和档案数字化副本在线查询;二是北京市档案信息网门户网站网上检索服务;三是档案馆举办主题展览和档案编研出版。

主要问题:档案馆应用系统没有编研模块。由于大量的数字资源存放于档案管理应用系统之外,档案馆不能进行大数据挖掘,不能对公众开展数据推送服务。

三、提升档案数字信息资源业务全流程管理绩效的建议

根据以上分析,北京市档案馆在数字信息资源业务全流程管理中存在的主要问题可以归纳为:档案接收没有建立在线接收机制;档案数据管理没有形成完整体系;档案数据存备没有检查销毁机制;档案数字资源利用方面缺乏数据挖掘等。针对上述问题,笔者提出了如下建议:

(一)档案接收

针对档案馆无在线接收机制问题,建议首先建立在线接收系统,并确定相应的接收流程。

关于电子档案接收的主要流程,笔者的建议是:检验电子档案数据、办理交接手续、接收电子档案数据、著录保存交接信息、迁移和转换电子档案数据、存储电子档案数据等。数据移交形式为在线和离线。

数据检验环节第一步进行数据安全性检验,查看有无计算机病毒;第二步进行数据的真实性、完整性、有效性检验;第三步进行数据准确性检验,核实机读目录是否准确规范;第四步进行数据可读性检验,如采取的是离线移交方式,则还需核实光盘目录是否准确规范,检查移交光盘的盘面是否清洁、有无划痕、是否具有可读性。移交单位和档案馆交接双方共同办理档案资料交接文据,由交接双方签字、盖章,各自留存,文据可采用电子形式并以电子签名方式予以确认。档案馆正式接收电子档案数据,应当对接收的电子档案载体保存5年以上。档案馆应当将电子档案交接、迁移、转换、存储等信息补充到电子档案元数据中。档案馆应当对电子档案数据迁移和转换前后的一致性进行校验。档案馆对电子档案载体应当按照DA/T 38《电子文件归档光盘技术要求和应用规范》和DA/T 15《磁性载体档案管理与保护规范》进行存储管理。

(二)档案数据管理

建议建立以资源库为核心的数据管理体系,该管理体系应包含以下内容:

1.档案数字资源库维护。档案数字资源库维护是一项经常性的数据管理工作,也是数字档案馆建设的核心内容。档案资源库一般包括目录数据库或元数据库、内容数据集等。元数据采集方式主要是通过对电子文件或数字档案的背景、结构和管理过程信息进行自动生成和适当人工添加而形成。内容数据集是数字档案资源建设的主体,它是通过数据库、数据仓库等技术方法将档案全文按照一定的分类、排序方式排列形成的集合。内容数据一般通过与目录数据挂接方式实施有效管理,随着信息技术,特别是检索技术的发展,将来也会采用其他技术方法对内容数据进行有效管理,对于由电子文件归档形成的电子档案,其内容数据还应与其元数据建立持久有效的联系,防止非法修改,采取技术措施,确保其可靠和可用。档案数字资源库还包含一些需要维护的数据库表,包括:代码库(代码表如密级、专业、部门)、主题词表、综合信息库(库房管理)、编研库。

2.数据整理数据整理。包括元数据增删改维护、元数据配置、元数据库管理、价值鉴定。

3.数据归档数据归档。包括格式转换、电子文件封装。

4.数据统计。包括报表统计和报表打印。

(三)档案数据存备

建议对档案馆藏的电子档案建立定期检查、迁移备份和销毁机制。

1.保管与检查。电子档案的保管环境应符合GB 50174-2008《电子信息系统机房设计规范》、GB/T 2887-2011《计算机场地通用规范》、GB/T 9361-2011《计算机场地安全要求》等国家标准的要求,以上标准始终以最新修订版本为准。在定期检查过程中发现问题应及时采取补救措施,检查方法包括人工抽检和技术检测。

2.迁移与备份。电子档案的脱机备份载体应选用磁带或硬磁盘,保存在脱机载体中的电子档案应每满4年迁移一次,数据迁移至新载体后即刻进行一次检查,原备份载体至少再保存4年,保存期满后按相关保密规定处理。用作电子档案备份的载体不得用于其他任何用途,档案数字信息资源可以按照三级备份体系实施,即以本地备份为基础、以同城备份为重大保障、以异地备份为重要补充。

3.销毁与处置。根据《电子文件归档与管理规范》(GB/T18894-2002),归档电子文件的鉴定销毁,参照国家关于档案鉴定销毁的有关规定执行,且应在办理审批手续后实施。属于保密范围的归档电子文件,如存储在不可擦除载体上,应连同存储体一起销毁,并在网络中彻底清除,不属于保密范围的归档电子文件可进行逻辑删除。

(四)档案数字信息资源利用

建议档案馆根据档案信息的利用需求和网络条件,分别通过公众网、政务网、局域网等建立利用窗口系统,并且应实现如下系统功能:

1.档案编研。系统应当能够辅助进行档案信息资源智能编研、深度挖掘,对数据重新收集、编辑、提炼。首先建立新的编研专题,通过系统提供的自动分类、自动聚类、智能发现、自动摘要、自动关联推送等功能将符合新专题条件的档案目录放入专题库,然后对专题库中数据进行编辑,形成新的说明信息,再对专题库中的资料进行提炼,形成编研材料,最终形成的编研材料通过信息发布的流程发布或出版。

2.综合查阅。系统应当能够运用最新检索技术方法满足利用者在各种利用平台对档案数据进行快速、准确、全面的利用查询要求。综合查阅提供目录检索、全文检索、元数据检索。使得所有用户在严格的权限控制下有效且高效地查询利用本人权限范围内的档案数据和扩展资源数据,包括条目信息和电子原文信息,并能对常用检索途径进行优化,满足用户对查全率、查准率的要求。系统可实现自然语言搜索和相似性搜索等智能搜索,支持对自动搜索到的全部信息进行智能分类,并可对设定的主题,将全部相关信息进行聚类,系统的自动分类和聚类功能可以以图形方式展示,方便用户定位到关心的信息以及了解信息分类之间的关系,从而实现档案数据的广泛利用。

参考文献:

[1]冯惠玲,刘越男.电子文件管理国家战略[M] .北京:中国人民大学出版社,2011: 2.

[2]梁建梅,陈少慧.教学档案的管理与信息化建设[M] .北京:中国书籍出版社,2013: 4.

猜你喜欢
数字信息档案馆载体
创新举措强载体 为侨服务加速跑
华人时刊(2022年9期)2022-09-06 01:02:44
坚持以活动为载体有效拓展港澳台海外统战工作
华人时刊(2020年15期)2020-12-14 08:10:36
北京尚水数字信息产品介绍
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
心理学报(2019年7期)2019-07-06 07:10:54
关于县级档案馆馆藏档案开发利用的思考
兰台内外(2017年6期)2017-05-30 06:46:41
全省部分档案馆新馆掠影
浙江档案(2017年10期)2017-03-31 06:27:31
TiO_2包覆Al_2O_3载体的制备及表征
when与while档案馆
数字信息时代图书馆职业权利缺失与回归路径
图书馆论坛(2014年9期)2014-03-11 18:48:08
创新德育教育载体
中国火炬(2013年11期)2013-07-25 09:50:19