民国档案数字化编目工作探索与实践

2018-10-24 08:49喻春生
卷宗 2018年19期

喻春生

摘 要:民国档案数字化前整理工作完成既定目标之际,必然要利用数字化成果,纵深开发、揭示档案信息,即整理工作向编目工作转型势在必行。探讨如何借助数字化成果、利用计算机技术、借鉴以往编目工作经验,满足外界需求发展、改进和加快档案编目工作具有现实和深远的意义。

关键词:民国档案;档案编目;编目工作

编目工作是档案馆重要基础工作之一,它的基本任务一是在档案整理过程中为档案管理和提供利用创造初步条件的基本编目(也称“初步编目”),编制保管目录或内部目录,便于档案实体管理,随着档案实体整理工作的基本结束,尤其是数字化前整理工作的完成,该项工作也已基本结束;二是在档案基本编目的基础上进行系统编目,借助数字化成果、利用计算机技术编制不同形式、多种用途的档案检索目录或开放目录,便于多途径检索和报道档案信息,这是本文所讨论的重点。尤其在全球大数据、档案馆迈向数字化、网络化和智慧化的今天,档案数字化编目工作将是档案馆重要和长期工作之一,它对档案信息资源的开发与利用,有着直接和决定性的作用。

实际是对“档案实体和档案信息实行双重控制的过程”著名档案工作者裴桐上世纪八十年代就曾希望将编目工作从整理工作中独立出来,“因为科学的编目工作是档案检索的必要前提。没有目录或者目录不能很好的反映内容,所谓‘开发档案信息资源就是一句空话”

民国档案数字化前整理工作完成既定目标之际,向编目工作转型势在必行“编目工作实质上脱离了整理工作,完成了从非独立系统向独立系统的历史性飞跃”

之所以档案编目工作在档案工作中淡化,是因为长期的整理工作一直作为档案馆重要工作,且编目工作仅限制作案卷目录上,或重视对档案实体管理的功能的实现上,现在随着这项功能基本完成时,就完全应该将工作的重点转移,0

1 借助数字化成果开展档案编目工作

中国第二历史档案馆(以下简称“二史馆”)的档案编目工作,经过几代档案人的努力,已建立了民国档案目录体系,以适应民国档案实体管理和对外服务的要求。二史馆的民国档案数字化项目基本实现既定目标,数字化前整理工作是民国档案数字化工程的基础环节。通过这一环节,对馆藏231万余卷、文件约 4500万件,合计约2.2亿页画幅馆藏档案,依据档案整理的基本原则、程序和方法,进行了案卷级的整理,基本实现了档案实体数字化,其数据加之原有目录信息为档案的编目工作创造了极为有利的条件,但是编目工作如何进一步发展、更加快速而准确地为利用者提供民国档案信息、实现档案信息资源共享是我们需要思考的问题。

1)揭示档案内容必然从案卷一级深入文件一级,对档案信息深度挖掘,将使民国档案目录多样化、其内容更精、范围更广。这是因为:案卷级目录数据数据概括性强 、难以准确反映其文件内容;档案中有很多重要信息还藏于案卷中未被开发,只有深入文件级才能完整揭示;案卷级中有不宜开放的档案,只有揭示到文件级才能区分。《“十三五”时期国家重点档案保护与开发工作总体规划》中,把“组织推进文件级目录采集,对国家重点档案进行系统整理和编目,建立国家重点档案文件级目录数据库、专题档案目录数据库、开放档案目录数据库,实现对国家重点档案有效监管”作为“十三五“时期国家开展重点档案保护与开发工作的首要任务,本馆文件一级编目工作也将为建设全国民国档案文件级目录数据库创造必要的条件。

2)档案编目形式由手工制作到计算机辅助完成直至改变为机器完全制作,这是档案编目发展之趋势,今天充分利用已有数字化成果,直接在计算机上对扫描产生的档案画幅进行编目变为现实。也有人称之为“数字化后整理工作”。利用、更新、开发、制作各种编目软件。比如,编制适合文件级著录软件、灵活编辑电子画幅,抽取所需关键词等等编目软件。

3)实现目录数据库网络化。利用数字化成果使在建的《馆藏民国档案目录数据库》,实现在馆局域网中流通和利用;并借助大数据技术,在互联网推进档案信息网站建设。做到标准统一、功能完善、安全可靠、利用方便,力争建立以本馆档案为骨干,国内乃至有关国家地区保存民国档案的档案馆参与的民国档案开放目录数据库,实现全球民国档案信息资源共享为最终目标。

2 以外界需求拓展档案编目工作

随着民国史研究工作的进一步深化,档案利用向着更广泛、更深入发展成为必然;同样,也随着大规模数字化前整理工作的结束,面对着数字化档案,都给档案工作,尤其是编目工作提出了新的要求,它是档案提供利用和发挥作用的先决条件之一。

1)一边开展,一边开放。民国档案数字化工作目的就是便于档案实体的保管和档案信息的利用,因此一经数字化后的档案,对其电子目录数据,采取“边审核、边开放”的做法,及时提供利用。从2013年开展数字化至今,每年年底都向社会宣布开放电子档案目录目前为止,先后开放的数字化档案全宗有:南京国民政府时期教育部、社会部、内政部、国民党中央宣传部等20余个全宗,计20万卷,近1500万个画幅,开放内容涵盖政治、经济、军事、教育、文化、社会等各个方面。

2)关注热点,优选编目。改革开放之初,本馆就积极配合各地编写地方志、行业志的热潮,打破全宗,把有关各地区的档案全部集中起来编制了《馆藏地区档案目录》,它不仅弥补了各地编史修志中缺乏民国时期第一手资料,还极大地丰富了地方档案馆馆藏、并提高本馆专题咨询服务的效率。

近年来,本馆为纪念抗日战争胜利六十、七十周年以及首个南京大屠殺遇难者国家公祭日,本馆就优选编制了《抗日阵亡将士名录》,《黄埔军校同学名录》、《南京大屠杀遇难同胞调查》、《抗战损失财产调查》等等专题目录,其中收录近20余万人的《抗日阵亡将士名录》开放以来,共接待与妥善处理个人查证1146列,占2008年以来查阅档案目录人数的24%。以上都是以外界需求开展的档案编目工作而优选编制的,极大的为党和国家大局,为社会关注热点等极为有利的服务。

同时积极主动,在档案杂志及相关报刊宣传、报道有关目录信息。还有修订《中国第二历史档案馆指南》亦应提上日程,这是专门介绍和报道本馆馆藏档案内容而编制的报道型目录。它为社会各界了解和利用本馆馆藏档案提供了重要的条件,尽可能全面满足利用者多方面的需要。但出版近二十年本馆馆藏情况也有不少变动,亟需要修改、补充,此次特别需要增加数字化档案的内容,使之更加利于查阅。

3)借助外力,合作编目。为弥补档案事业经费的不足,同时又能借助外力发展档案事业,上世纪九十年代开始就为主动前来本馆寻找或合作意愿开发民国档案资源的机构,如原邮电部文史中心、中国银行、中国人民银行、中国烟草协会、英国剑桥大学等机构出资与本馆合作整理开发相关档案并编制有关目录,目前形成有《馆藏邮电档案目录》、《馆藏中国银行档案目录》、《馆藏中央银行档案目录》、《馆藏海关档案目录》、《馆藏烟草档案目录》、《馆藏新疆地区档案目录》等专题目录,条数近60万。

3 以经验教训改进档案编目工作

民国档案编目工作,通过建馆近七十年、几代档案人的努力,建立了适应民国档案实体管理和对外服务要求的目录体系。虽然编目工作取得了较为可喜的成就,但在长期的工作实践中也取得了一些经验和教训,对此进行必要的总结,也是为了更进一步加强和改进民国档案数字化编目工作。

1)编目工作要从实际出发,逐步建立和完善目录体系。从实际出发,就是从馆藏档案的实际状况和外界检索利用档案的需要出发,我馆馆藏档案数量巨大,已整理编目的档案就有220万卷之多,不可能一蹴而就迅速建立一套完善的包括多种用途、各种形式的档案目录体系,只能采取切实可行的办法,逐步地建立并完善。对此,我们有过深刻的教训。上世纪八十年本馆就曾进行研制馆藏档案文件级目录数据库工作,但未获成功。主要是当时不切实际地将数据选择以文件级入手,企望一步到位,不知当时技术、设备等条件限制,如数据库库内容量、字段字节等等,以及文件目錄的数量及制作的难度。因而研制速度十分缓慢,始终不能投入实际使用。以后,通过总结经验,确定揭示档案内容只宜采取先案卷级、后文件级适合本馆实际的有效办法建立一套不同用途的案卷目录并在此基础上建立的案卷级目录数据库,然后再按照档案馆长期目录建设的要求,制作文件级目录数据库,以适应长久的需要。

2)编目工作要科学化、规范化、标准化。档案馆编目工作是一项科学性很强的工作,只有科学理论的指导,并采用科学的办法,才能保证做好。档案馆要提高自身编目工作科学水平,保证和不断提高编目工作质量的需要,就必须努力实现规范化和标准化,即为适应数字化编目工作发展需要而制定有关的原则与方法的确切表述和具体规定,它包括专业名词术语标准、代号代码标准、著录标准、标引语言标准等。目前,民国档案分类标引和主题标引,已有了《民国档案分类表》和《民国档案分类主题词表》,以及根据国家行业标准《档案著录规则》和部颁标准《档案分类标引规则》等规则,结合民国档案和民国档案工作的实际状况研制的《民国档案著录细则》、《民国档案分类标引细则》和《民国档案主题标引细则》,这些规范化的标准,都是进一步完善和改进民国档案数字化编目工作,提高编目工作的科学水平和质量的保证。

3)编目工作要做好统一规划、分工协作。在建立和完善档案目录体系过程中,必然会编制各种功能、多种形式等种类繁多的目录,如不统一规划、分工协作,将会出现各种目录之间的平行、重复、多头,互不联系等问题,造成不必要的浪费现象。比如,我馆曾同时建有《分类目录数据库》、《案卷目录数据库》、《馆藏档案库位数据库》三个目录数据库,虽从不同的角度满足了一定时期本馆档案利用和管理工作的需要,但由于分属于三个部门,且档案处于不断的变化之中,如档案重新整理、接收等,各种目录处于动态管理之中。因而在经过了一段时间之后,目录数据与档案实体、三套目录数据之间不尽一致,使馆藏档案和目录的统计各不相同。今天借助档案数字化成果,应用数字化编目手段,整合、发展、改进和完善目录数据,实现网络化,迎接档案馆的智慧化,以适应大数据时代下之要求。

为此,在实践中要求做到:

1)确立主要目录数据。目前就是利用数字化成果,以经过数字化前整理后的电子目录数据完善《馆藏民国档案目录数据库》,使其数据库为馆藏各类目录数据的高度整合,集全宗、案卷、文件等信息于一体,实现一站式档案信息检索,同时也是档案调出、归位等实体管理的依据;按照《民国档案分类表》进行的以分类标引为主、主题(关键词)标引为辅的数据信息导航功能;设有包括档案全文信息检索在内的众多检索入口,利用者可以通过某个检索入口进行初级检索,也可以运用灵活方式进行提问式检索等高级检索;具有利用连接功能,除了掌握目录利用情况,还可知道利用者对目录利用后的反馈信息;除满足利用者从不同的角度查找所需的任何内容,还可根据需要,打印完整的全宗目录、案卷目录、文件目录、各种专题目录及至原始档案版面不失真的显示与打印;保证数据库内的每个数据都有清晰的利用者使用权限;多样化的目录形式,随时公布目录的更新与开发信息,满足不同类型、不同行业、不同规模利用者个性化的信息需求;遍布全国和海外的民国档案目录数据交换服务中心,配上常年的利用者培训与高效的技术支持。

2)正确处理各种目录之间的关系。对于各种不同的目录,要予以正确认识和妥善处理,处理好分类目录与主题目录之间的关系,在完善分类目录体系的同时,积极地创造条件,逐步建立主题目录,是两者之间相互结合、互为补充,以适应查验档案的需要;处理好手检目录与机读目录之间的关系,力求使手工检索目录能符合计算机输入的要求,使手检与机检相结合,要求新编目录必须规范化,而对原有目录不随意否定和废弃,应充分利用原有目录的基础,对不足的部分加以必要的补充,不够完善的部分加以完善。

3)克服编目工作中的形式主义。不问实际效果如何,一味强调目录的完整性,重要性,一种类型的目录编制几套等,这将会造成目录庞杂、重复和浪费。比如上世纪八十年代,为了迅速迎合外界对民国档案信息的需求,盲目编制所谓“重要文件目录”,但很快废弃,档案中何谓“重要”与“非重要”,标准很难把握。因此,一开始就应注意这一类问题,从而避免目录出现重复和浪费的问题。

总之,做好数字化编目工作,必须从本馆收藏的民国档案实际情况出发,有分析地吸收经验教训,准确地理解档案数字化编目工作的任务和要求,借鉴先进的计算机技术手段,合理有效的借助外力,才能将民国档案数字化编目工作做到又快又好。

参考文献

[1]全国档案信息化建设实施纲要[J].中国档案,2003(3)

{2}曹必宏.中国第二历史档案馆光辉历程[M].北京:九州出版社,2011.

[3]杨冬权 在全国数字档案馆(室)建设推进会上的讲话[J].中国档案,2013(11)

[4]马振犊、方鸣主编《海峡两岸档案数字化工作学术研讨会论文集》[M]中国文史出版社2015.12