来源视角下的地方历史文献整理流程研究——以上海交通大学图书馆为例

2016-03-15 22:21
文化学刊 2016年12期
关键词:历史文献上海交通大学文书

汤 萌 张 洁

(上海交通大学图书馆,上海 200030)



【文史论苑】

来源视角下的地方历史文献整理流程研究
——以上海交通大学图书馆为例

汤 萌 张 洁

(上海交通大学图书馆,上海 200030)

上海交通大学图书馆针对地方历史文献馆藏制定了由入藏、编号、修复、编目、归库构成的标准整理流程。在整理过程中,依据来源信息编号、来源状态归库保存,并且在编目中设计体现来源信息的元数据项目,即档案号、日期、事主、归户、地域等。从来源视角整理地方历史文献,并应用于后续的数字化、数据库开发过程,将有助于研究者在多脉络的环境下观察文献,推动地方历史文献的文献学方法、数据化分析及其他新的研究议题。

地方历史文献;来源原则;数字化;归户;元数据

一、问题的提出

2006年,上海交通大学历史系在浙江省松阳县石仓地区发现一批保存完整、连续性好的契约文书,并将这批资料整理出版,形成一系列针对清代乡村社会的研究。[1]此后,2009-2013年间,上海交通大学历史系又通过文书市场搜集近35万件各类民间文书,并转入上海交通大学图书馆(以下简称“上交大图书馆”)保藏、整理。地方历史文献通常与图书馆入藏的书籍性质不同,因此,近年来研究者已先后讨论如何建立资源分类法,如何对资料进行数字化建设和数据库开发[2-4],并已有成功利用这些资料的案例。[5,6]

2012至今,笔者参与了这批资料到馆后的整理加工工作,本文将总结上交大图书馆已经形成的整理流程,提出并论证“来源视角”作为地方历史文献整理原则的合理性与推广建议。目前,以馆藏资料进行研究,主要是针对已经整理完成后的状态,即数字化与文献研究。但是,地方历史文献这类资料应如何整理,以适用于数字化建设与文献研究,在此前的研究中尚未提及。在徽州文书与清水江文书的整理中,尊重民间文书的来源为学者们所重视。[7,8]不过,目前这些整理原则、方法主要是以纸质出版为导向,上交大图书馆的整理流程则自始即以数字化为导向,因而对实体保藏、扫描、编目都进行了面向数字化的规范设计。

二、地方历史文献的整理流程

整理实务中,图书馆馆员们归纳了文献整理的标准流程,即初次编号、杀虫除尘、二次编号、修复、扫描、归库。上交大图书馆入藏的地方历史文献来自文物市场,在入藏前经过了一定的流转过程。流转过程中,书商通常只是用报纸等对文献进行简单包装,并且流转过程中的受潮、虫蚀等问题都在所难免,文书间的位置关系也比较复杂。上述整理流程正是针对这样的现状提出的。2009-2012年间,入藏的资料暂存于上海交通大学历史系山极晃文库,使用密集书架放置。2012年之后转入图书馆以开放式书架保存。

(一)初次编号

文书搜集过程中以“包”和“袋”为单位。“包”是书商在收集过程中形成的文献群单位,“袋”则是收集者在不同时间收集到文献的聚合单位。文献入藏后,登记“包”和“袋”的收集时间,以及文献所保留的地点、人物等来源信息,并制作文献的编号卡片。这在整理流程中称为初次编号。

(二)杀虫除尘

文书整理初期使用冰箱除虫,此后改用冲氮杀虫法。所有文书在清点及二次编号前以原始状态进行杀虫、除尘。

(三)二次编号

文献转入整理流程后,拆去原始包装,逐渐清点文书,喷水后用鬃刷刷平整,之后进行二次编号。每件文书的编号为14位号段。编号由“来源人物码(2)—收集日期编号(6)—包排列序号(2)—件排列序号(4)”组成。来源人物码的含义是文书市场中的搜集来源人,收集日期编号即入藏日期,也即“袋”的编号,包排列序号指书商收集过程中的顺序编号,件排列序号则是在打开每一包时,顺序清点赋予的流水号。编号用宣纸裁成的纸条贴于文书背面。由以上步骤形成的14位编号是每一件文书的唯一身份识别号码。操作中,单件文书每一页计为1件,簿册文书每一册计为1件。

每完成一包编号,需及时登记,登记内容包括操作时间、包号、单张件数、成册件数、需修复件张数等,据此撰写《上海交通大学地方文献编号工作日志》。流程管理员登记每天编号工作进度,统计工作总量和速度,根据《编号工作日志》填写《上海交通大学地方文献需修复文献跟踪表》。

(四)依据不同破损程度确定流程

本流程规范在制定初始即划分“需修复文献”和“不需修复文献”。“需修复文献”修复完成后,需转入扫描包装流程,而“不需修复文献”可能在扫描时受到损伤,需转入修复流程。所以,两项工作的交叉无可避免,如何在修复扫描完成后有序地汇总整理成为整个流程畅通有效的重要问题。依据破损程度设计流程的核心原则是完成整批次修复后才能进入下一批次修复。

(五)修复

在清点与编号过程中,工作人员发现大量文书存在破损情况,因此也制定了修复流程。修复管理的难点是要保持多流程平行协作。整理流程中,文书清点、编号后将直接扫描,但破损文书则需要修复后再扫描。因此,修复流程管理中,需要同时在扫描文书流程中登记修复中的待扫描文书,并在修复文书流程中登记修复文书所属的待扫描序列,也即管理两个平行工作的流程。

(六)扫描

上交大图书馆新藏地方历史文献以电子化利用作为文献整理与资源建设的主要方向,因此,文献清点后全部进行扫描。扫描的难点是出图的规格与质量。正式扫描前,需要平整文书,这样平板扫描时,图片上不会有褶皱的痕迹。扫描质量应根据后期用途决定。尤其值得注意的是,单件文书如果纸张背面也有字迹,也应当扫描,正面与背面的扫描图合并为一个图档,方便使用者阅读。

(七)归库

文书完成编号、修复、扫描后,将归入库藏保存。文书使用宣纸、塑料储存箱及开放式书架(樟木柜)保存。文书以“包”为单位保存,每一个来源的“包”在保藏时归并在一起,单件文书每10件用1张宣纸包裹,簿册每册用1张宣纸包裹,全部文书依编号顺序放入储存箱。再将储存箱按照初次编号顺序排列在开放式书架上。仓库中配有温度、湿度检测,保证恒温恒湿环境。

三、整理流程的方法论:来源原则

地方历史文献为何要按照以上方法进行整理?笔者提出的文献整理方法论是来源原则。来源原则是档案学中的概念。档案学的全宗原则(respect des fonds)指同一机构或个人创建、积累、维护、使用的资料必须按照原始顺序(如果有的话)放在一起(视为属于同一集合体)。[9]也就是说,应以文献产生时的来源单位作为文献保管的基本单位,从而避免打破文献之间既有的有机联系。经典的档案学理论认为,“向文件中心或档案馆移交文件之前,在事务活动过程中形成、保管和/或利用文件的组织或个人”,即构成来源。[10]此外,档案学理论认为,文件具有生命周期,包括文件从产生直至因丧失作用而被销毁或者因具有长远历史价值而被档案馆永久保存的整体运动过程。[11]

地方历史文献具有与档案相似的性质。本文所说的地方历史文献主要指两类材料:一类是民间日常生活中形成的文书,亦可称之为民间文书;一类是基层政府行政中形成的档案。前者往往具有功能性,是为了应对民间生活中的具体事务书写形成,如土地买卖、借贷、婚丧、宗教仪式等。具体事务结束后,文书也就完成其使命,永久或半永久地放置不用,这正如档案学所说的文件生命周期。也正因此,事实上,人们今天所面对的民间文书仅仅是漫长历史过程中保留下来的一小部分,绝大多数民间文书已经在使用结束后自然消亡了。至于后者,则本身即为档案,完全可以使用档案学的整理方法。

来源对于地方历史文献具有特殊的意义,它区别于物理形态、内容信息,属于文献身份识别的本质属性之一,它独立于文献实体和内容信息,存在于历史流传过程中。简言之,来源包括文献产生、流转,以及保存的时间、地点、人物、事由和状态。整理实务中,我们在归户栏中登记文献来源的人或社会组织及其所属的行政区划、家族信息,由此反映文献与文献之间的关系,有助于整理者回溯文献形成的过程。

地方历史文献可以应用来源原则进行整理,整理实务中,以收购方式或田野调查方式获得的文献应使用不同的来源登记方法。对文献内容进行编目及元数据处理时,人名、地域等能反映来源的信息也应采用标准化的提取与描述,以便于后续的数据库开发与研究利用。

四、整理及数字化过程中来源原则的实现

目前,地方历史文献类的馆藏,主要有通过收购渠道获得,通过田野调查获得实物或电子档复制品等途径。通过收购渠道获得的文献,以上海交大馆藏为例,多数在入藏时仍然保留着来源信息。实际上,采购者在收购时就倾向于购买来源信息完整的文献。在某些地域甚至已经形成了固定的来源信息标准化格式,如交大馆藏的部分福建文献,其来源信息包括归户、收藏时间、包数、每包件数,每一次收购来的文献都记载以上详细信息,其归户格式为“省—县—乡—村—姓氏”。

通过田野调查获得的文献,其保存类型分为入藏文献实物与入藏文献复制品两种。为了保留文献原有的保存脉络,最大程度地还原来源,上海交大将大多数田野采访所得文献留在当地,将原件扫描、修复后返还原有主人。

前文未详细介绍的有数字化的核心环节,即元数据组织,也是通常所说的编目,它是数字化与数据化的中间环节。地方历史文献数字化工作不仅仅是对文献扫描,更是一个集合了整理、分类、修复、扫描、编目和数据库建设的完整流程。因此,除扫描和修复等技术外,描述性元数据的设置与组织也是整理中的难点。图书馆学中,描述性元数据是组织揭示文献资源的技术工具,通过描述文献资源的内容、范围、权限等信息,在文献资源与用户之间构建起使用的桥梁。描述性元数据可以定义为“描述和识别信息资源的特征以及分析信息资源知识内容的数据”,一般包括用于识别某信息资源的数据(如题名、作者、制作或出版日期、支撑数字对象的原始对象信息)、知识组织数据(如责任者控制、姓名、主题等与相关主题的搭配,多个实体之间关系的识别),以及知识访问数据等。[12]通常,元数据可提供发现、识别、选择、获取文献资源的信息,并提供资源互操作的途径。

从数字化的终端成果看,建立专业的分析型数据库是目前被广泛接受的形式,而编目与数据库的功能设计紧密相连。数据库蕴含的分析功能能否实现,取决于数据库功能的设计与编目质量,编目字段的设计与数据库功能框架相关。

五、结语

上海交大图书馆在整理地方历史文献的过程中遵循了来源原则,由此进行了一系列整理及加工利用,每一个环节的操作都是为了保护文献和它的来源脉络。来源形成于文献的形成过程,但需要整理者建立针对性的整理方法以及设计标准化的元数据描述才能得以体现,并使研究者可以观察、检索、应用文献的来源信息。

对来源信息的考辨也将有助于发展地方历史文献针对性的文献学方法。地方历史文献与传统古籍具有不同的文献学性质。在传统文献学中,重视考据古籍的年代、序跋、牌记、纸张、墨色和避讳等信息,从而形成古籍的版本脉络。而在地方历史文献研究中,从来源切入,考据文献的形成过程,也是发展与丰富针对性的文献学方法的有效途径。

来源信息还将有效推进文献的数据化分析。标准化描述的来源信息有助于挖掘文献之间的关系,包括同一归户下或不同归户之间,通过对档案号实施分段截取,可以获得同一来源的文献,即同一收集日期以及同一归户(地方文献产生来源的人或社会组织及其所属的行政区划、家族信息)的文献,以此类推,保留了契约文书的原始获取信息及顺序关系。这些信息将在后续的数据库开发中发挥重要作用。

[1]曹树基.石仓契约的发现、搜集与整理[J].客家学刊,2009,(6):146-172.

[2]李芳,陈进,王昕.上海交通大学图书馆新藏地方历史文献的数字化建设规划与实践[J].大学图书馆学报,2015,32(2):77-83.

[3]赵思渊.上海交通大学新藏地方历史文献的分类法及其依据[J].上海交通大学学报(哲学社会科学版),2015,22(3):76-87.

[4]赵思渊.地方历史文献的数字化、数据化与文本挖掘——以《中国地方历史文献数据库》为例[J].清史研究,2016,(4):28-38.

[5]赵思渊.19世纪徽州乡村的土地市场、信用机制与关系网络[J].近代史研究,2015,(4):82-97.

[6]贾晓阳,章毅.清代初期的徽州田价:《乾隆休宁黄氏置产簿》研究[J].农业考古,2016,(3):62-68.

[7]刘伯山.民间文书档案整理的“三尊重”原则[J].安徽史学,2015,(6):16-19.

[8]张应强.清水江文书的收集、整理与研究刍议[J].原生态民族文化学刊,2013,5(3):33-38.

[9]冯惠玲.论档案整理理论的演变与发展[A].吴宝康,丁永奎.当代中国档案学论[M].北京:中国档案出版社,1988.115-167.

[10][11]冯惠玲,张辑哲.档案学概论(第二版)[M].北京:中国人民大学出版社,2001.198.201.

[12]王松林.信息组织工具论[J].山东图书馆季刊,2008,(4):5-9.

【责任编辑:周 丹】

G254.1

A

1673-7725(2016)12-0219-04

2016-10-20

汤萌(1986-),女,山东烟台人,助理馆员,主要从事图书馆学研究。

猜你喜欢
历史文献上海交通大学文书
上海交通大学
太行山文书精品选(17)
监狱执法文书规范探讨
上海交通大学参加机器人比赛
上海交通大学附属第六人民医院胸外科简介
黑水城出土《宋西北边境军政文书》中“砲”类文书再讨论
历史文献纪录片中蒙太奇的运用
珠镶玉嵌 蔚为大观——读《都江堰文献集成·历史文献卷(近代卷)》
关于回鹘文书中几个词的探讨
《疾风图》