档案整理的规范性探索

2018-01-24 00:51张爱曾
山西档案 2018年1期
关键词:整理关联文本

文 / 张爱曾

档案整理有多种方式,广义上指的是考证、鉴定、编撰档案,狭义上指的是档案分类、编制目录、排列案卷等[1]。档案整理是为了更方便利用和保管档案信息。从实践角度看,档案整理包括文本整理和数据整理两大类。随着现代信息技术的发展,各级档案馆数字化建设进程加快,档案整理已不再局限于文本,基于互联网的数据整理变得越来越重要。

一、传统模式下的档案整理:文本整理

(一)档案文本整理的构成

档案文本不但包含了传统类型的纸质文件,同时也包含了一些简单的电子文件。文本整理是将文件转化成档案的必备条件之一,无论哪一种类型的文件,都需要通过详细的整理才能更好地反映出历史信息[2]。没有经过整理的只能叫做“原始档案”,经过整理的才是“系统档案”。“原始档案”和“系统档案”的区别在于:“原始档案”仅要求有一定量的档案信息,“系统档案”则除了信息之外,还要求各类信息之间根据预定的顺序进行排列,以发挥出档案的整体功能。“原始档案”仅强调信息元素的集合,“系统档案”则进一步强调信息之间的关系结构。通常来说,只有经过整理的具备内部关系结构的档案,才能更好地反映出各文本信息的历史关联,具备历史记录功能及历史再现功能。

(二)档案文本整理的发展历程

档案文本整理的发展源远流长,至今已经形成比较成熟的原则和方法。早在十六世纪,欧洲档案界就将“事由原则”作为档案文本整理的基本原则,用于登记整理各皇室档案。十八世纪初,“尊重全宗原则”在法国诞生,被档案界广泛采用。二十世纪中叶,荷兰人论证了档案文本整理的“来源原则”,由此确定了该原则在档案文本整理中的地位。1908年,德国著名档案学家布伦内克构建了“自由来源原则”,进一步修正了原来的档案文本整理基本原则,按照一定比例分配档案信息来源和事由[3]。我国近现代以来比较流行的是“尊重全宗原则”。何嘉荪教授提出了“客观全宗”概念,对我国档案文本整理的影响较大。从档案文本整理的历史渊源看,保持文本历史关联是档案界永恒的追求。

(三)档案文本的历史关联作用

档案文本的历史关联也叫做档案内在关联,主要是指文本产生以及处理中构建起的内部联系,一般体现在档案文本的来源、保存的时间、信息内容及表现形式等方面,其中档案文本来源的关联最为重要[4]。但是档案文本来源关联与历史关联并非是等同的,而只是历史关联的展现形式之一。当前的档案文本整理有不少只是强调文本来源关联,用这种来源方式掩饰更本质与宏观的历史关联,存在一定的偏颇。所以档案文本整理要有较高的历史性原则,而不是只坚持本文来源原则。文本历史关联可以在档案整理的多个层次得到应用,如全宗划分层次、档案分类层次、立卷层次等。此外,保存时间的关联、信息内容的关联、表现形式的关联等,也可以作为档案历史划分的依据,使档案文本的历史关联更加丰富。

二、互联网时代的档案整理:数据整理

(一)档案数据整理的基本方式

档案数据是一种数字化的信息形式,可以在数据库中得到永久保存。相对于档案文本来说,数据形式有了计算机和互联网的支持,赋予了档案整理新的功能及意义。档案数据主要反映出以下三种信息。首先是档案内容,这是档案的本质所在,同时也是档案信息最大的主体,可以充分体现出历史原貌。其次是档案形式,即档案信息格式、代码标准、排列规则等。再次是数据载体,即数据通过怎样的平台进行整理和传输。由此可见,档案数据的整理方式,主要围绕内容、形式、载体进行,将内容进行数字化处理,形成适合网络储存和传播的格式,而载体也多种多样,包括数据库、网络平台、各种新媒体等。档案数据整理在文本整理的基础上有了大幅飞跃,在理论意义上可以达到永久保存,储存空间也更大,在信息分析、传输、修正等方面具备更多优势。

(二)档案数据整理的结果

通过档案数据整理,形成了丰富的数据检索目录,如全文索引、题目索引、案卷索引等,或者根据文号、类型、地名、人名等进行检索,构建一个全面性的搜索网络,使档案数据在整理之后能够提供强大的服务功能。而随着互联网及信息技术的发展,档案数据整理更方便地对每一份档案所包含的信息进行详细描述,有效录入单份档案的全部特征,并通过网络平台任意组合这些特征,在多途径的条件下实现全方位检索。档案数据整理既反映了各档案信息的历史关联,又反映了信息之间的逻辑联系。从这方面看,档案数据整理在很大程度上超越了文本整理,但又离不开文本整理的特质。首先,文本整理作为原始档案最初的整理形式,在档案管理过程中不可或缺,数据整理需要文本整理的支撑,才能发挥出更大的作用。其次,数据整理是文本整理的“加强版”,甚至在某些情况下可以脱离文本整理,在互联网上采集更多的信息,但许多珍贵的权威的档案,还是需要文本进行提供。

(三)档案数据整理的载体形式

档案数据整理需要一定的载体才能顺利实现。从当前的情况看,档案数据整理的载体形式主要有数据库、信息采集软件、文本扫描系统、智能检索系统及各类新媒体等[5]。其中数据库建设是档案数据整理的核心环节,只有具备合适的数据库,才能使档案数据整理有实践意义。目前比较流行的数据库有SQL server、Oracle、Aceess、MySQL等,具体采用哪种数据库要视数据系统的实际情况而定。信息采集软件则是用于捕捉网络相关信息,不断丰富档案资源库内容。文本扫描系统用于档案文本的扫描著录,对原始文本进行数字化处理。智能检索系统是提供档案服务的重要方式,用户可以通过各类型的检索享受到档案数据整理所带来的便利性。此外,随着网络新媒体的快速普及,越来越多的档案馆开始通过新媒体平台传播信息,如通过官方微博、微信公共号等,为广大用户提供档案服务入口,增进档案馆与用户之间的联系,使数据系统有更多的平台对公众开放服务。

三、档案整理的规范性:文本整理与数据整理的共存

(一)文本整理与数据整理都是为了实现档案的社会性

档案是为社会服务的,这是一个不争的事实。社会的发展离不开人类的各种社会活动,这些实践活动涵盖了社会的方方面面,甚至具体到每一个事件,都会生成一定的档案信息。与此相对应的是,所有档案信息都有一个属于自己的具体事件。而当社会实践活动完成之后,事件就会成为一段历史。无论是档案文本整理还是数据整理,都存在着历史关联性,这也说明两种整理都是为了实现档案的社会性。历史和档案也是相对应的,档案有着较强的历史价值,即便时过境迁,原来的社会活动场景已无法再现,但档案记录了当时的痕迹,提供给后人查阅的机会。传统档案整理主要是文本整理模式,相对来说在全面性和保存性方面有所欠缺,但档案文本是最原始、最真实的信息,同时也是档案数据的母体,绝大多数的档案数据都是通过档案文本数字化转变而来的。所以,充分发挥档案数据整理的优势,填补文本整理中的空缺,有利于找到档案和历史的一一对应之处,最终揭开历史真实的“面纱”。

(二)数据整理有助于文本整理的社会活动重构

档案与社会活动关联密切,两者的主客体关系也是动态的。在社会实践活动发展的过程中,逐渐形成有价值的档案。在这种情况下,社会活动是主体,档案是客体。当社会活动结束以后,逐渐成为一段历史,只在档案中留下记录痕迹,这时档案就变为主体了。档案文本整理主要是为了分类原始档案,对已经发生的社会活动进行重构。任何历史片段都是由社会活动碎片组成的。档案工作者在厘清档案与社会活动的关系之后,需要对这些碎片进行必要的整理,确保档案信息的真实性,能够对社会负责、对历史负责[6]。而档案数据整理则是基于文本整理发展起来的,在帮助文本整理重构社会活动方面,数据整理可以起到很好的辅助作用。首先,数据的便捷性扩大了社会活动的重构范围,有助于档案文本满足多样性的社会活动利用需求。其次,在社会活动重构的过程中,档案文本提供了详细的依据,重要文本内容可以进行数字化处理,形成长久的保存方案,将一些社会活动资料纳入到数据整理中,从而形成文本和数据的双重保护。

(三)文本整理和数据整理是一个有机的整体

文本整理是一项传统的档案整理方式,需要大量的人工处理,工作效率较低。而数据处理借助计算机和互联网,形成了自动化的处理模式,极大地解放了人力。在数字化时代,档案信息可以在不同的载体上面自由转换,提升了档案整理效率。但这只是一种整理模式上的进步,文本整理依然不可或缺,两者是一个有机的整体。许多卷宗还是需要经过文本的初步整理,才能提供更多的数据来源。从形式上看,文本整理是一种有形的整理,而数据整理超越了纸质资料,将有形化为无形,可以在网络平台上实现深度检索[7]。对于文本整理来说,文件排列与著录是隔离的,需要单独进行,而数据整理则有效合并了这两个环节,这样可以解决文件不能及时著录的问题,更真实地对历史情况进行反映。无论是档案文本还是档案数据,具备更多联系的“文件集合”远比单一文件的价值高,这就需要两种处理方式相互补充,发掘出一定数量的“文件集合”功能,全面提升文本整理的覆盖范围,并使数据整理具备丰富的资源潜力。

(四)数据整理的信息裂变拓展了文本范围

信息裂变是数据的一大关键功能,在数据整理中,信息裂变可以大大拓展档案文本的范围。例如数据整理捕捉到一条原始的文本信息,就会比对数据库中是否存在关联信息,这样就会发现第二条、第三条甚至更多的相关信息,而且后面的信息也可能存在关联度,这样就产生了信息裂变现象,使得一条档案信息能够带出一系列的关联信息。数据整理根据档案文件之间的逻辑联系,构建起一个庞大的数据检索系统,有利于信息裂变的快速实现。这种现象在生活中有着极大的应用价值,例如历史学家在翻阅历朝历代文本档案的同时,可以通过数据系统的搜索,全面掌握与主题相关的各种信息,便于自身的专题研究;地质学家在分析地震灾害的过程中,除了翻阅气象档案之外,还可以借助信息裂变的方式,深入数据系统查找相关信息,这有利于地震灾害原因的准确发现,根据一定规律现象为地震预防提供决策依据。由此可见,无论是文本整理还是数据整理,都能在信息裂变的基础上扩大检索范围,在提高档案文本利用价值的同时,也使数据系统发挥出更大的效用。

参考文献:

[1]吕永明.档案整理和数字化加工服务外包的实践与思考[J].档案与建设,2016(8):69-71.

[2]刘丽平.归档文件按“件”还是按“卷”整理问题研究[J].北京档案,2017(4):21-24.

[3]郑慧玲.档案的物质结构与档案整理[J].山西档案,2014(2):48-50.

[4]王协舟,尹伟沣.《归档文件整理规则》解读——基于新旧规则两个标准的文本分析[J].档案学通讯,2017(4):75-79.

[5]朱琪.民国档案数字化前原数据整理编目[J].中国档案,2015(2):50-51.

[6]郭鹏.北京大学对清代内阁大库档案的整理及其启示[J].山西档案,2016(6):15-17.

[7]王勤.规范档案整理 促进档案移交——解读《中央档案馆文件级档案接收质量检查办法》[J].中国档案,2016(12):29.

猜你喜欢
整理关联文本
文本联读学概括 细致观察促写作
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
作为“文本链”的元电影
在808DA上文本显示的改善
“一带一路”递进,关联民生更紧
基于doc2vec和TF-IDF的相似文本识别
奇趣搭配
智趣
高一零碎知识整理
整理“房间”